权重衰减的lambd大小与参数的范数大小关系

请问:权重衰减的lambd大小与参数的范数大小之间有什么关系吗?
在notebook中:
Example0: lambd =1 , L2范数= 0.356 ; L1范数 = 4.7
Example1: lambd = 3 , L2范数=0.076; L1范数 = 0.729
Example2: lambd = 30 , L2范数= 0.011; L1范数 = 0.7025
Example3: lambd = 660 , L2范数= 46959.60; L1范数 = 14.62

感觉应该lambd越大,对范数的限制越强,但是为什么会出现增加的情况呢?