线性回归

我没有答案啊,这是我自己做的,我也不知道我做的对不对。先看着吧,这要多刷几遍才能真正理解吧

30 Likes

倒数第二个式子是B+\sum_(i=1)^n 吧

@sofnfpfpfp @jerry729

在知乎上看到一个讲解的不错的……

但是下面的评论说展开存在问题,我看不出来,希望有大佬来看看,没问题的话我想做个pr提交到源文件中,目前的解释的确让人有点摸不着头脑

1 Like

3.2我认为令绝对值为0不对,这个最小化的并不是导数,所以不是等于0.而是要让绝对值的和最小。但这个涉及了带有绝对值的函数最小化,不知道怎么去求解析解

我想请问一下,在这一节中,老师指出使用小披量的原因是遍历整个训练集太慢了。如果我本身训练集就不大,我是不是可以不采用小批量,而是直接每次迭代都使用整个训练集计算梯度并更新参数W,b呢?还是说我应该选择更小的batch size,比如就是1?

(我在网上看到说可能重复使用整个训练集的方法会带来过拟合?)

谢谢!

是这样,同意。
我觉得argb的这种表述确实更清晰,但行数列数说反了。

1 Like

3.1.12转化一下形式得到ε=y-w*x-b,带入到ε的概率密度函数中,便得到了似然函数。

Thanks a lot. It really helps.

L1展开那里合并了不该合并的项吧,就下面留言有。
此外对标量L求B的偏导应该也有问题,结果的维度应该是跟B转置的维度相同,但他跟B维度相同。

Σ|y(i)-w(T)x(i)| 可以改成Σ(y(i)-w(T)x(i))^2这样就变成了二范数求最小值的问题

3.1.15的求和符号后是不是缺少一个大括号 :grinning:

2 Likes

各位老师,我使用d2l的时侯,有很多类似的符号:


我是不是有什么软件包没有安装,才导致这样的显示?

3 Likes

同问,这个标签看起来是索引,类似于图1,式1,表1这样

2 Likes

你理解错了吧,第一行不是所有样本的第一个特征的集合,而是第一个样本的所有特征的集合

1 Like

你这完全反了,矩阵X是n行d列,现有样本数量n,特征数量d。行数是样本数,列数是特征数。

2 Likes

把 b 直接放到 w 中,当成一个参数,然后 X 新增一个特征,其值恒定为 1,这样一乘,就好了。

1 Like

3.1.15式子求和符号后面少了一个大括号。

The summation symbol in Equation 3.1.15 is missing a curly bracket.

同求,有找到课后习题答案的友友能分享一下吗 :grin: