只从Parameter Server这个名字上,体会不到这个重要性。
- Parameter Server是参数服务器, 参数是特征的意思么?
- Parameter Server的核心是KeyValue存储。 Redis也可作为KeyValue存储, 有哪些致命缺陷? 貌似需要在大数据、机器学习场景下, 需要解决高维稀疏特征空间问题。 有关于“高维稀疏特征空间”问题的专门分析不?
上面是针对“怎么快速理解Ps在机器学习中的重要性? ”问题的自问自答, 方便后面跟大家交流, 也记录下自己从0开始的思考过程。
另外还有的问题:
- 推荐系统的特征动辄上亿、上十亿,每个特征的embedding也可能是16位、32位也不短,这么大的参数量是一台master所容纳不下的。
- 要将这么大的参数量“广播”到各slave节点,占据的带宽、造成的时延也是不敢想像的。