1. 首页

技术层面浅谈淘宝搜索

前段时间把阿里系几个人写的书都买回来仔细研读,一是本来对网络技术发展有兴趣,二是这也能从另一个层面给我们电商从业人员找到针对理论的技术原理支撑。

先说搜索,淘宝最开始是买了套开源的商城源码,没有搜索,随着产品增加类目检索已经无法满足需求,就把阿里巴巴(b2b)系统的搜索引擎拿到淘宝凑合用,这显然也难以支撑暴涨的淘宝产品数据库,这时候雅虎雪中送炭把雅虎中国当作嫁妆送给阿里,作为当时世界前三的雅虎搜索技术给淘宝搜索奠定坚实基础。这时候得提提鬼脚七,说鬼脚七就得说周鸿祎。周鸿祎最开始是流氓软件鼻祖3721创始人,3721被雅虎收购后,周负责雅虎中国。雅虎收购阿里巴巴35%股份,雅虎中国归了阿里,周鸿祎痛苦离开,鬼脚七没跟着周鸿祎走,随着雅虎中国嫁入阿里并且主导淘宝搜索的研发运营工作,淘宝搜索技术支撑着淘宝、天猫和eato。现在淘宝归属etao,天猫自成一家,聚划算也自成一家。当然还有b2b、阿里云公司等。好啰嗦的感觉,这几天淘宝搜索改版又让各大培训火了一把,万变不离其宗,下篇文章技术层面写搜索。

读书收获举例:

  1. 属性、标题放在数据库参与检索,描述页开始也在数据库,11年以前图片空间还是很热闹的,淘宝描述图片需要从其他服务商购买空间,后来淘宝做了自己的图片管理系统,再后来整个描述都放在cdn,我的意思是描述早就移出数据库,跟搜索扯不上关系。就没必要纠结在描述上是否放文字了,手机端要求放文字完全是出于对视觉的尊重。

  2. 千人千面(根据买家购买能力和爱好不同,推荐不同产品,产生不同的搜索结果)。这是个高大上的东西,它的技术支撑就是热火朝天的大数据。车品觉去了阿里负责大数据之后开始分阶段试验,去年双十一有几个分会场针对买家购物习惯等建模做了有针对性的产品推荐,测试参与人数大约有30%,效果也是非常好的。车总对大数据是很严谨的,要求数据的制造、采集、分析等等过程必须真实可靠,否则宁可扔掉。整个论调我是这样理解的:淘宝、天猫包括最近说要推直通车的千人千面现在的参与比例都不是很高,原因很简单阿里不会在技术成熟之前全切换,再者大部分买家购物流程是打开淘宝先搜索确定要买哪件再登陆购买,现代人还有良好的生活习惯浏览网站记得清空cookie,按照车总是路子,这部分人群数据没法采集不能推荐啊。

  3. 老A说的回归商业本质。技术理解就好,不要总想着挖掘搜索算法方面的事,三五天一调整那点技巧就瞎了。选好产品做好服务是基础,搞好类目属性描述和标题,最后才是流量。

刚写完看到微博:淘宝直通车个性化搜索上线。