欢迎关注“创事记”微信订阅号:sinachuangshiji
文/新智元
编辑:段亮亮、张佳
北京时间10月1日凌晨,网易有道向美国证监会(SEC)递交招股说明书,并于10月16日更新招股书,宣布将于10月25日登陆纽约证券交易所,拟发行560万股ADS,发行区间为15美元-18美元,股票代码为“DAO”。
据网易有道招股书显示,网易有道整体营收持续增长,2019年上半年营收达5.5亿;2018年全年营收7.3亿,同比增长60.5%。其中以在线课程为重要组成的智能学习业务成为有道第一大营收来源,2019上半年智能学习业务带来3.1亿元营收,同比增长58.1%,占总营收的57.4%。
谁能想到,有道成了网易旗下最先IPO的子业务。那么,一个做词典产品的公司怎么就上市了?
清华学霸扎堆,做搜索失败的网易无心插柳有了道
丁磊软磨硬泡,周枫入局网易做搜索
熟悉的朋友都知道,有道做搜索起家,网易有道词典也是基于搜索技术的应用。2006年,百度搜索与搜狗搜索的快速发展映出了搜索领域的商业价值,网易创始人丁磊也由此想试水搜索领域,于是找到周枫布局搜索业务。
周枫是典型的技术型学霸,在1996年以无锡市理科状元的身份考上了清华大学计算机系,拿到了清华大学计算机科学学士和硕士学位。在清华期间,周枫担任清华大学科协主席,和他的同学在9号楼建立的局域网是国内最早的一批局域网。随后周枫创建了赫赫有名的交友网站ChinaRen,后来被搜狐收购,但一心想做教授的周枫选择了去加州大学伯克利分校攻读计算机科学博士。
按照这样的路线,周枫很有可能成为一名大学教授,但2004年,他平静的日子被的一封邮件打破了。这封邮件没有内容只有一个标题:我是网易的丁磊,找你有事。说这话的丁磊当时才33岁,前一年他刚刚以75亿元的身家当选为中国首富。经过丁磊的软磨硬泡,周枫加入了网易。
清华学霸扎堆,有道故事开始
周枫充分发挥了学霸的人脉,找来吴迎晖、金磊、刘韧磊等众多清华学子推进搜索业务的落地,但搜索业务在互联网浪潮中未掀起预期波浪。周枫曾经在采访时提到这个阶段是最痛苦的时候。“那时搜索我们有一定业务量,但是看起来很难做出来,我们就做了一个很艰难的决定,把搜索业务停掉了。”
而在此期间,搜索这颗大树上长出了新芽。网易有道一个程序员自己觉得市面上的英语词典不好用,所以想做一款更好的产品出来。想法提出后,另一个做搜索算法的工程师便用数据做了实验,实验结果获得了大家认可,网易有道的故事由此开始。
2007年9月,网易有道词典进行了首次公开发布,成为国内第一个基于搜索引擎技术的互联网词典。2011年用户数突破1亿,同年我国网民数量为5.13亿,相当于每5个网民中就有1人使用网易有道词典。
凭借众多垂直产品的成功,开发出了包括词典、翻译、云笔记等多款教育相关的工具产品,并在相应的领域都做到了行业领先的水平,网易有道也顺势从搜索技术转向了教育领域。
搜索正式终结,找到在线教育之路
作为有道001号员工,网易有道副总裁吴迎晖提到,所有东西都是有时间周期的,越往后面,大家会发现这个空间越来越小,后来就发现搜索这件事情其实是很困难的,即使到现在其实还是很困难的。
2013年,有道词典业务在经过两年的商业化尝试后率先实现盈利。叠加网易有道词典展现出巨大的发展潜能,2013年8月,有道的搜索尝试正式宣告终结。
周枫看到了词典与教育之间的强关联,“当我们把词典做起来时,我们就觉得应该做教育了,大概在11、12年吧,到现在至少六年了。但最初做教育确实条件不成熟,没法付费,带宽也不行。所以那时候有想法、做不了,怎么办?”
以直播形式模拟“隐性围墙”,尝试在线教育
周枫认为线上教育不赚钱主要是因为没有“围墙”,无法将学生关住。对此,有道14年开始做课程,推出“有道学堂“进行摸索,并终于在15年发现了线上”隐性围墙“——直播。这种“隐性围墙”发挥作用有两点原因,一是直播有时间限制,二是直播更有临场感,这解决了用户听课率、专注度和交互度。16年“有道学堂”更名“有道精品课”。
周枫通过直播发现,最关键的一环就是优秀的老师,由此归纳出TEACH模型(“T”为学习工具型APP带来的用户基础(Tools),“E”代表与优秀的老师共赢(Educator),“A”即人工智能(AI),“C”即高品质内容(content); “H”为智能硬件(Hardware)。这成了有道做教育的模式。
网易有道成为网易教育业务的核心布局,all in K12
在模式引导下,有道不断发展成为国内用户量最大的互联网教育品牌。2018年4月17日,网易有道召开发布会,宣布完成首次战略融资,估值达11.2亿美元。网易高级副总裁、有道CEO周枫介绍称,“此次首轮战略融资具有里程碑的意义。主要用于有道在围绕用户创造价值方面的深耕, 一方面是打造优质课程内容, 第二大方面是加大教育科技上的持续研发和投入,给用户提供更优质和丰富的体验,通过教育去释放每一位个体的潜能。”
2019年3月19日,原网易公司教育产品部运营的“网易云课堂”“中国大学MOOC”等产品已并入网易有道。二者业务合并后,由网易有道负责教育业务,将重点聚焦K12(指学前教育至高中教育)培训。自此,教育与游戏、电商、音乐一同组成了网易的四大业务模块,而网易有道则成为了网易教育业务的核心布局。
早期以“网页萃取”(Page Extraction)技术先发制人,并持续开疆拓土
早在网易有道初期推出词典业务时,有道词典便依托有道强大的搜索引擎后台,开发出先进的“网页萃取”(Page Extraction)技术,在业内率先推出“网络释义”功能,以技术先发制人。
2017年10月,有道拿出了第一款AI学习硬件——有道翻译蛋。在过去两年间,有道已经陆续打造了8款AI学习硬件产品,除了两代词典笔之外,还有有道智能笔、有道云笔、有道翻译蛋与有道翻译王等等。
另外,多产品搭建矩阵,涵盖完善的用户使用场景。有道针对教育和学习相关的许多需求场景,花了近两年时间进行布局,现已形成了一个学习型智能硬件的产品矩阵:主打翻译场景的有道翻译蛋、有道翻译王2.0 Pro;面向快速查词需求的有道词典笔 1.0 和 2.0;可以随身携带打印单词的有道口袋打印机;能将手写墨迹同步到手机上的有道智能笔和有道云笔。
首席科学家段亦涛:有道AI团队擅长落地,能坚持把效果做到极致
其实,有道研发团队的官方名称是“有道研发AI Lab”,但网易有道首席科学家段亦涛喜欢直白叫“有道AI团队”:“我觉得Lab这个东西有点不接地气,很多公司都有很多Lab,尤其是很多research lab,他们很多都是在做一些学术性的东西,发文章等等。这个固然重要,但我们其实是一个不一样的团队,我们更着重做落地。”
“有道AI团队最大的区别是我们真的不是停留在实验室的阶段。”段亦涛表示,他强调,现在人工智能的的技术,从它自己发展的角度来看,最关键的也是落地。“我们一定要落地。我们在落地的过程中产生一些创新性的成果可以作为论文或者是专利发出去,但这些东西是我们的产物而不是目标。”
OCR、机器翻译算法做到极致,再冲10分
目前,有道最引以为傲的就是机器翻译和OCR技术,早在2014年,有道就开始了早期的尝试,后来又赶上深度学习的技术变革,有道把整个新的技术吃透了并落实到引擎里。
“像机器翻译、OCR这样东西,OCR是我们啃下来的,也是我们这个团队和其他产品团队不太一样的东西,别的产品做了除了功能之外找别的新功能应用,因为需要持续迭代产品不断吸引用户,但对于我们而言,一个能力可能需要做到极致。机器翻译的算法,我们要翻译得准,拿到40分还不够,我们还要冲50分,OCR也一样。”段亦涛说,“技术研发不做到极致,在实际应用当中是没有价值的。有道团队比较适合做长期坚持的,把效果做到极致的一些事情。”
在今年7月广州举行的GMIC大会上,网易有道AI能力首次对外集体亮相,让我们认识了一个技术流的有道。
AI加码神经网络翻译、图像识别、语音识别合成和自适应教育四个领域:
神经网络翻译(NMT):在学习和新闻测试集中,有道NMT的中英互译准确度均优于同行,最好成绩领先7个百分点。
图像识别(OCR):拥有国内可识别语言最多的OCR识别引擎,且能应对多种高难度场景,平均准确率可达95%;
语音识别与合成:有道语音识别技术在一些场景上识别准确率超过98%,支持中、英、日、韩多个语言;有道语音合成引擎音色逼近真人,支持中、英、日、韩、葡等多个语言;
自适应学习:配合自研的智能学习硬件,实现实时采集书写数据,并且提供如学情分析、知识图谱评估、智能推题等一系列自适应学习辅助。
攻克OCR技术难关,有道自研词典笔查词效率提升15倍
虽然手机几乎已成为人人必备的电子设备,但在教育和学习相关的许多需求场景,手机的使用受到限制,此外,手机上的诱惑太多,本来是查个单词,结果刷起了微博,有道词典笔应运而生。
今年8月,有道词典笔2.0问世,通过有道自研的AI技术赋能,“一扫即查”的智能查词比传统纸质词典的查词效率提升了15倍。而这样一支神奇的笔背后也面临着许多技术难题,用段亦涛的话来讲:不光是最后的识别的OCR,词典笔这个场景还有很多其他技术挑战。
在识别OCR方面,第二代的词典笔是更符合用户书写习惯的笔,你可以斜着来扫,也可以不同的方向来扫。虽然看起来是很简单的事情,但对识别算法提出了更高的要求。“首先采样采的照片因为浮动和曲折,会有一些偏差。偏的话,光照会有透视效应,远的会小,近的会大,这和直着拍完全不一样。我们必须把这些问题都处理好,把它还原到比较标准的行,后面才能够识别好,这一步要做的工作就很大。”段亦涛解释道。
不仅如此,还需要把所有的技术压缩到一个小小的笔里面,而且还要离线,难度可想而知。凭借一个扎实的团队,有道做到了,而且做得很好。自上市以来,网易有道词典笔在市场上获得强烈反响,其销量在行业同类产品中遥遥领先。据有道招股书显示, 2019年上半年,有道智能硬件收入4310万,同比增长264.7%,其中很大一部分得益于有道词典笔和有道翻译王等产品在用户群体中大受欢迎。
公式识别、拼音识别、超模糊手写体识别、多角度多语种混合排版识别,实现多场景应用
OCR是网易有道王牌技术之一,尽管2014年就已上线基于传统规则方法的OCR技术,但2017年,有了基于神经网络技术的加持,OCR引擎的质量明显迈向了新台阶。
OCR技术最直观的功能表现就是拍照翻译。截至目前,有道OCR识别技术已经支持26种主流语言文字的支持,是目前国内识别语言最多的OCR识别引擎。
同时,网易有道的OCR技术是国际市场首家支持以下功能:
多语种全自动判别与混合识别
支持360度任意角度图像的文字识别
支持文字语义方向为横排、竖排或者混合排列的文字识别
同时,针对“AI+教育”这一场景,有道OCR团队进行了专项优化,研发出了一系列在国内市场上处于垄断性的优势技术,例如:
实现了公式识别,支持公式转为LaTeX功能,准确率达到93%。输入图示例:
除此之外,有道的OCR技术也能应对拼音识别、超模糊手写体识别、多角度多语种混合排版识别等高难度场景,平均准确率可达95%。
同时,针对K12用户(尤其是少儿用户)高难度手写场景进行优化,识别准确率高达85%以上,是业内唯一支持高难度教育场景的手写OCR服务。
可离线AI技术满足各类AIoT硬件需求
这些均可离线的AI技术将这些能力部署在多种移动端上,满足各种AIoT硬件的需求。目前有道的各个AI技术均支持离线,OCR识别的模型离线后加起来只要50M。
有道OCR以主流智能教育硬件为基础,构建了完整的教育场景OCR技术链路。
工具+在线教育+智能硬件三方合力,上市之后有道路在何方?
有道将自己定位智能学习,一家专注于学习产品和服务的互联网科技公司。目前,有道对业务进行了4大版块划分:
学习工具类应用:在推出有道词典后,网易有道还陆续发布有道翻译官、有道云笔记两个产品,它们与词典共同构成了网易有道的工具业务线。
在线课程:这条业务线启动于前文提到的有道精品课战略(如今还包括今年上半年并入的网易云课堂和MOOC业务),并在2018年进一步聚焦到K12领域,现已成为网易有道营收的主要来源和未来的最大增长点。
智能硬件:自2018年开始,网易有道陆续发布了有道翻译蛋、有道智能笔以及网易有道词典笔三款硬件产品,今年8月也发布了四款少儿启蒙类课程产品和一款智能查词硬件。周枫曾表示教育类的智能硬件是个还未被开发的蓝海,网易有道还将继续投入这一业务。
内容互动课:有道数学、有道乐读等,能够让学生在移动设备上与虚拟老师进行互动学习的课程应用。
无疑,网易有道成功上市将给有道发展注入新活力,但后续发展,还需看网易有道如何实现在线教育市场破局。关于未来怎么走,丁磊曾表示网易将专注科技创新,做正确的事,“往前看,我的心态和刚创业时没什么不同:希望网易能务实、专注地通过科技创新,改善一些人的生活,对社会起到积极的影响,为国家发展创造价值。这是正确的事情,把它做好,做到极致,就很了不起了。”