电影《末日重启》中有这样一句台词:“你有没有想过,世界上还存在一个镜像世界,那里的一切都和你的生活一样,就像我们熟知的平行时空那样。”
在这样一个特殊的时间点,或许已经有不少人开始思索这个问题,如果我们可以从“镜像世界”看到自己,如果我们可以在两个多月前叫停那些吃“野味”的人群,社会就不会停摆,我们的生活也不会被外力打乱。
然而现实世界中可能并不缺少这样的“平行时空”。
两个多礼拜前,华南农业大学公布了最新的研究成果,穿山甲正是新型冠状病毒的潜在中间宿主。但在更早前的一个礼拜,百度发布的搜索大数据报告显示,穿山甲雄踞过去十年中“野味搜索”的第一位,类如“野味的做法”和“野味馆”的百度搜索大数据同样呈现出较为明显的季节性波动,这说明即使经历非典之后,依然有人对吃野味这件事情有独钟。
从中不难梳理出潜在的因果关系:搜索作为用户主动获取信息的方式,所产生的搜索大数据直观地暴露了民众对于“野味”的热情,隐藏在这些数据背后的用户行为,正是为疫情爆发而种下的“因“。
抛却疫情这般沉重的话题,保留一些“私心”将目光看向商业世界,看到的却是企业家、创业者们的“诉苦”,诸如“现金流只能维持三个月”“给员工发不出工资”之类的声音比比皆是,而非尝试从现实世界的“镜像”里寻找活下去的答案,思索“黑天鹅”可能带来的新机会。
本文想要讨论的正是这样一个话题。
“搜索直接连接大脑”
“搜索直接连接大脑”,谷歌联合创始人谢尔盖·布林提出的概念被不少人解读,甚至有人猜测谷歌一开始就想打造连接人与世界的“脑机”。
或许无须这般深奥的猜测,谷歌不止一次对外宣称:“搜索的最终目标是理解人的意思”,没准这就是谢尔盖·布林的题中之意。厘清了搜索引擎的价值,也就不难理解搜索数据由少变多,再到大数据的现实意义。
首先,谷歌和百度的主页大概是互联网世界中最简单的UI,有人给出的解释是“偶然性”的产物,搜索引擎诞生的时间还是拨号上网的年代,为了保证网页加载的速度,以及节省服务的流量成本,最简单的选择无疑是最好的选择。
暂且不去论证此类说法的正确性,简单到极致的搜索框恰恰是破解“搜索直接连接大脑”的关键所在。当用户面对这样的搜索框时,看不到太多的干扰因素,由此养成的习惯就是:在搜索框里输出自己想要答案的关键词,一种最原始也最纯粹的“主动寻找信息”的场景。何况人们并不缺少雅虎这样包括搜索框的门户或导航网站,为用户提供了这样或那样的选择,最终却和PC时代一起走向了衰落。
其次,人们的每一次请求,搜索引擎都知道人们在寻找什么,正如人们的所有行为都会在互联网上留下痕迹,而搜索引擎占领了捕捉和分析这一行为的最佳路径,针对这些用户行为的抓取、存储和分析,甚至可以揣摩用户搜索之前的动机来洞察新的趋势,指引下一阶段的走向。
即便到了移动互联网时代,超级APP逐渐崛起,数据孤岛逐渐形成,“投喂”模式的内容分发已经成为新潮流,可搜索仍然是最高频的用户行为之一。谷歌在全球范围内的月活用户超过了10亿人次,国内每天也有10 亿人次通过百度搜索了解疫情,同时移动互联网又进一步扩展了搜索引擎的能力边界,除了搜索的关键词,还有搜索的地点、设备、方式,数据不仅在增“大”,也在变“深”。
之所以用如此长的篇幅来阐述搜索的意义,无非是想要回答这样一个问题:记忆和联想是大脑最重要的两种思维方式,记忆是互联网的优势所在,联想的路径是什么?这也就引出了搜索大数据的价值,即洞察、预测、研判……
毕竟搜索作为网民的“意图数据库”,当然可以根据某一专题搜索大数据的的涨跌,预测下一步的市场走势。
“像上帝一样俯视”
搜索大数据的“一战成名”,还要从谷歌的GFT说起。
2008年谷歌推出了一个名为Google Flu Trends的应用,翻译成中文就是“谷歌流感趋势”,通过汇总分析用户的搜索数据,对全球的流感疫情进行估测。2009年美国H1N1流感爆发的几周前,谷歌的工程师们在《Nature》上发表了一篇论文,预测了H1N1在美国的传播,并且具体到了特定的地区,事后证明与美国疾病控制和预防中心(CDC)的官方数据相关性高达97%,时间上却提前了整整两周。
只是谷歌的GFT也有“玩砸”的时候。
2014年有研究人员在《Science》上发表文章指责GFT的糟糕表现,文章的标题相当直接——“谷歌流感的寓言:大数据分析的陷阱”。原因在于,2011年8月到2013年8月之间的108周里,GFT有100周的流感发病率预测高过CDC,2012年到2013年的预测发病率已是CDC报告值的2倍多。
不过这并不是唱衰搜索大数据的理由。
打这样一个比方:在一个交通流量密集的十字路口,实时记录行驶过的车辆和发生的交通事故,如果上礼拜一的车流量是1万辆,不难在下个礼拜一记录到大致相同的数字;可如果上礼拜一发生了两起交通事故,很难说下个礼拜一定会发生交通事故,因为交通事故是不确定性事件。
简而言之,搜索大数据在不确定性、随机性事件中的预测可能会出现不小的偏差,但对确定性、趋势性的事件,几乎可以用“研判”一词来形容。
直接的例子就是有人用Google趋势多次成功预测了比特币的价格走势,毕竟加密货币的价格变化直接取决于外界的关注度,当用户搜索比特币正面关键词的标准差增加时,预示着比特币的价格将有所上升,而负面关键词的标准差增加时,往往会在一段时间后出现价格下降的情况。
国内也不乏这样的例子。
比如在线教育的百度搜索大数据在今年春节后不久就开始猛涨,这比在线教育概念股的疯涨足足提前了两个礼拜左右。可以给出的合理解释是:1月23日武汉封城的消息曝出后,一些家长就开始焦虑孩子开学的问题,在线教育相关关键词的搜索量开始迅速增长。
此外,疫情的消息传出后,新型冠状病毒肺炎症状之一“咽喉痛”的关键词搜索开始呈现出上升趋势,折射了人们对于自身情况的担忧,可能会引发焦虑情绪和心理健康问题。对于内容生产者和平台方,及时辟谣并加大权威信息、科普信息的权重,可以说是防疫过程中必要的一个环节......
假如人们可以在黑天鹅出现之前,对市场的走向做出准确的洞察,或许可以像上帝一样俯视乱象中的危与机,而非无奈的“诉苦”。
不应被忽略的金矿
关于大数据价值的“警示”,几乎成了老调常谈的话题。
早在1980年,著名未来学家阿尔文·托夫勒就在《第三次浪潮》中,将“大数据”描绘为“第三次浪潮的华彩乐章”。
2012年,IBM CEO罗睿兰的观点更为直接:“大数据不亚于一种新的自然资源。数据在我们当今时代的角色就像是蒸汽、电磁和化石燃料对之前时代的角色一样。它有潜力推动更高一层的社会进步和繁荣。”
也正是在2012年,美国、欧洲、日本、韩国等先后启动了政府带头的大数据研究与开发计划,国内也在当年的“十二五”规划中明确提出要支持海量数据存储、处理技术的研发和产业化。
只是大数据在国内的用户基础似乎还很贫瘠:微信每年都会放出一份大数据报告,告诉我们什么是最受欢迎的年度表情;支付宝每年都会公布一份年度账单,用数据诠释过去一年中花了多少钱,花在了什么地方;至于百度搜索大数据的应用,可能是不少营销人的必备工具,更广阔的B端市场对其的关注度还有不小的增长空间。
比如手机厂商已经习惯于从搜索大数据中追踪舆情,然后根据用户的喜好制定相应的市场营销计划,却没有耐心从亿万用户的搜索大数据中挖掘产品痛点在哪里,反而喜欢从几千人规模的调研数据里找答案。
再比如提到经典的数据应用案例时,很多人想到的还是沃尔玛“啤酒与尿布”,也折射了当下零售商的窘境:执着于在自家的仓库数据中找到可能的商品关联,如果进一步分析搜索啤酒的用户背后的动机是什么、还会搜索哪些商品,是否会制造更多的可能?
另一个现实而迫切的问题是,疫情期间每天有超过10亿人次在用百度搜索获取信息,沉淀了海量的用户数据,这些用户们出于什么样的需求,基于什么样的诉求?幸运的是,已经有不少人尝试从野味、口罩等数据中给出了一些洞察,可这些疫情期间的搜索数据如何优化社会治理体系,如何预防下一次疫情的出现,还需要进一步下功夫挖掘。
就像疫情期间同时发生的生鲜抢购和农产品滞销,对这些数据进一步挖掘整理,是否可以对供应链的调整给出科学的指导;不同地区的医学关键词搜索情况和当地的医疗体系进行关联分析,或许可以以远程诊疗的形式弥补医疗资源分配不均衡的问题;以及不同地区“口罩”、“消毒水”等防疫用品的搜索情况,大致可以洞察出当地的需求强弱,引导政府调整医疗物资的分配......
至少对站在产业转折点上的中小企业而言,在现金流远不能和巨头匹敌的局限下,搜索大数据这座金矿可能是拉平差距的唯一筹码,谁能掌握挖掘大数据的“黑魔法”,无疑将在竞争中多一些胜算。
写在最后
“镜像世界”并不是科幻电影的专属,而是耶鲁大学计算机科学家David Gelernter在1991年提出的概念。
彼时给“镜像世界”下的定义是:镜像世界是将一些巨大的结构性的运动的真实生活,像镜像图景一样嵌入到电脑中,通过它你能看到和理解这个世界的全貌。长达30年时间的科技演进,现实世界正在1:1映射变成数字社会,特别是在物联网的推进下,整个世界都在“可读化”,“镜像世界”已然从概念成了现实。
其中搜索大数据正是“镜像世界”的组成部分之一,或许我们还不能从人类的尺度观察世界,但从商业的尺度来洞察潜在的机会点,并不缺少一定的可行性。正如那句有些鸡汤性质但不失哲理的话:当你改变了看世界的方式,你就改变了你所看到的世界。
- 2021-11-27 腾讯所有APP将暂停版本更新!这是什么情况?
- 2021-11-17 qq飞车手游的技巧已公布,你觉得难度高?
- 2021-10-20 脱单盲盒是风险项目有可能会国家管饭你信吗?
- 2021-09-29 迪迦奥特曼再次上架 这是什么情况
- 2021-09-13 soul是什么软件 小编给你讲解
- 2021-04-13 支付宝整改,花呗可能断连
- 2021-01-28 百度网盘“闲时下载卡” 是什么套餐?还8.9元一月?
- 2021-01-15 作家助手写作步骤是什么?小编为你讲解
- 2021-01-12 HDP直播电脑版怎么下载?在什么平台下载?
- 2020-07-23 支付宝299积分兑换1元红包 随时可能黄
- 01-01Dumpster安卓下载安装,Dumpster数据恢复3.13.404专业版
- 12-21大数据开发工程实践课程(24.9G大小) 六星教育导师主讲
- 11-26R,Studio电脑安装包下载,R,Studio数据恢复8.17中文便携版
- 10-28数据哥直播带货运营教程分享
- 10-26手机电脑数据恢复软件(19个)打包分享
- 09-28大数据结构算法分析教程
- 09-28Python数据分析教程
- 08-17数据恢复WinHex v20.3 SR,2优化版
- 08-16数据恢复精灵APPv10.1.1安卓会员版
- 08-15大数据项目教程 尚品汇电商团队主讲
- 219408℃全国新型肺炎疫情实时动态分享
- 3751℃快手网红沫沫换衣事件 网友你怎么看?
- 592℃百度网盘“出事了” 网友可以看看
- 564℃诛仙北冥有声小说
- 529℃武汉野味商铺闭店,千万记住别什么都吃
- 494℃今日头条推荐机制你了解多少?小道活动网带你详解
- 364℃执播电影《庆余年》全集资源遭泄露是怎么回事 官方称已报案
- 315℃香港大学专家袁国勇:已研发出新型肺炎病毒疫苗种子
- 291℃新型肺炎病来袭 如何做好自我防护
- 270℃应对新型冠状病毒 多家超市及便利店打响“口罩保供战”
- 10-20支付宝新上线晚点付功能 芝麻分700以上可以开通
- 10-16淘宝宣布退出并下架台湾市场 这是怎么了?
- 10-13腾讯虎牙斗鱼合并 成为直播界大赢家
- 10-10阿里云网盘公测预约开始了 下载不限速很香
- 10-07百度总裁李彦宏批评内容推荐算法
- 10-02百度网盘普通用户内存即将由2T降至100G
- 10-02腾讯35亿美元收购搜狗 搜狗改姓马
- 09-30微信v3.0.0PC版新功能 小编为你详解
- 09-30腾讯微信视频号助手全面开放使用 来试试看看效果如何
- 05-14国家认证的新兴职业“互联网营销师” 快来看看
- 相关文章
-
- 12-21大数据开发工程实践课程(24.9G大小) 六星教育导师主讲
- 11-20百度官方关于索引量工具数据异常的公告 站长看看吧
- 07-08据可靠数据:微信公众号自媒体账户超2000万
- 05-17数据库CouchDB入门学习教程
- 07-22数据恢复WinHex v20.3单文件版
- 09-13快速算法技巧 数据结构与算法365天特训营
- 02-02DiskGenius硬盘分区工具下载 DiskGenius数据恢复v5.1海外版
- 10-12好程序员人工大数据智能课程 多学总受益
- 01-302021年高考倒计时源码带数据打包分享
- 10-03微信数据删除软件下载 微信数据自动删除工具V2.0