当前位置: 首页 > Web前端 > HTML

2021CS5340-4340

时间:2023-03-28 17:32:09 HTML

2021年秋季CS5340/4340项目6分100(UG)或200(G)截止日期:12月9日,11:59pmr>该项目正在实施正则化回归,正则化参数是通过交叉验证估计的。不要使用任何包,除了使用随机数生成器和矩阵运算(如果有的话)。也就是说,不要使用任何将回归、交叉验证、岭或套索作为内置函数实现的包。使用函数y=f(x)=x2+10通过在-2<=x中对x进行均匀随机采样来创建大小为12(即j=1到12)的随机样本(xj,yj)(训练数据)<=10。再取5个点(x-y对)(对x在同一区间内均匀随机抽样)作为测试集。确保训练集和测试集没有共同点;在不太可能发生重叠的情况下,只需重新采样。获得y在x上的非线性(二次)回归。在没有正则化的情况下执行此操作。接下来,实施liy对x的正则化近似回归(使用“脊”回归,λ∑2),从三重交叉验证中获得λ。尝试以下λ值并使用交叉验证选择一个值:0.1、1、10、100。[仅适用于研究生部分;这部分将要求您查找、阅读和实现课程中未涉及的算法]最后,将上面第2部分中的ridge替换为“套索”,λ∑||,重新计算。请参阅ISLR书中对套索的详细描述。请注意,该项目没有使用单一的固定验证集,因为3折交叉验证安排多个验证集从训练集中隐式获得;也就是说,我们没有使用传统的三组(训练/验证/测试)场景,而是使用两组(训练/交叉验证/测试)场景。在您的报告中清楚地提供以下项目列表(补充源码):(a)训练集中的十二个(x,y)值和五个(x,y)va(b)在第1部分中得到的非线性回归关系方程;样本内误差;和测试误差。(c)λ的值和相应的交叉验证误差(四对)从第2部分的交叉验证阶段获得(也在第3部分的研究生部分)。(d)最后的(best)λ您在第2部分(以及第3部分的研究生部分)执行交叉验证后选择的。(e)您在正则化后获得的回归关系的最终方程(您应该在所有12个点上使用最终λ重新训练在训练集中);相应的(最终的)样本内误差(说明在计算该误差时使用了多少点);以及相应的测试误差。(f)说明您是否通过分析获得了最终(最佳)λ。只是陈述(无解释)。(g)对于山脊(和毕业部分的套索),安排你的三个数字错误(交叉验证错误,最终样本内(训练)错误,测试错误)按升序排列。绘制您的数据点和最终解决方案(手动或使用绘图软件;使用该软件不加分)。具体来说,您的图应在x-y平面上显示12+5个点和两个(研究生部分三个)最终解决方案(以及它们各自的方程式)——一条用于无正则化回归的曲线和两(三)条用于正则化回归的直线——在同一平面上plot.请注意,我们原来的x在这里是一维的。以平方差的平均值作为误差。提交说明同前。请在Canvas上提交单个pdf(或Word或文本)文件。如果您发现很难将文本/图形和代码合并到一个文件中,请提交多个pdf文件(不要上传zip文件)。不要只是在网络上的某个地方提供指向您的代码的链接。如果您提交任何手写(和扫描)的东西,请写清楚。WX:codehelp