会上,达观数据CEO陈运文也发表了主题演讲。陈运文预测:“10年后计算机将代替人类完成50%的基础、机械、重复的文字处理工作,大型政企客户也将会配备有相应的计算机软件系统完成智能化转型。”
以下是陈运文演讲实录,由品途商业评论(ID: pintu360)精编整理(有删减):
人工智能在大量的企业当中,都有应用场景,达观做的是文字的阅读理解这件事情。达观是一家做文本的智能化处理的创新企业,致力于用先进的文字处理技术,让更多的企业能够用上非常好的文本处理系统,能够让计算机代替人进行文字挖掘、搜索、推荐等等相关功能。
平均每个人每一天1/3的时间用在和文字打交道上
汉字最早诞生的时候是刻在甲骨上,人类发明文字之前,人类和动物一样,只能把我们掌握的信息和对于自然界的了解,通过我们的基因传给下一代,一代一代的传承下去。但基因能承载的信息非常有限,它没有把更多的智慧传承给下一代。
在人类的文字诞生以后,通过记载的方式,把文明一带一带的传递下去,能够让人类的智慧,人类的文明程度不断的提升。人类对于文字的运用和理解已经有几千年的历史,后来也进化到了对文字的加工、处理、解读方面,这个早在两千多年前的古罗马时代凯撒大帝时代就已经进行了。当时有个方法叫凯撒加密法,把古罗马的字母做了一个轮盘的转换,把每个字母,比如A这个字母,它把它换成D这个字母,B换成E。
再看今天,信息化程度已经非常高了。我们各行各业,所有的文档,大家知道,不管你用word、PPT、pdf、邮件、微信,大量的信息都在以文字的方式承载、传递。平均每个人每一天,大概有接近1/3的时间用在和文字打交道上。
不管是文字的阅读、写作、处理还是报表的处理,这些工作耗费了我们每个人非常非常多的精力和时间。举个例子来说,我那时候在百度,我们发现一月份的时候,用户在百度上搜索年终总结的量是飙升的。
我们希望能不能有朝一日,让计算机帮你写作,减轻你的工作负担。所以我们想,如果计算机有一天有能力,协助我们来完成文档的审批、写作的工作,这是非常有意义的事情。也是达观致力于做的事情。
计算机有海量的阅读和极强的记忆能力,让计算机来做文字的信息处理挖掘能力,这件事情是比人更快更强的。
而如果把人工智能分成三个领域,图像、文本、语音,达观就是在其中文本挖掘领域里中国最领先的企业,我们技术也用在各行各业各个区域。如今文字的自动化处理,正在面临一个非常好的机遇,因为深度神经网络这个技术经过十多年的发展,已经越来越来成熟,尤其是用在文本处理领域。
未来10年一半的工作会由计算机代替人类完成
今天计算机处理挖掘文字能力,已经很接近人类的水平了。另外从成本的角度来看,今天2018年计算机的运算成本远低于一个人工成本。一个普通的白领一年的成本要十万,或者更多。但是今天,一台随便的普通的计算机才几千块钱,一台商用的服务器两万块钱,成本远低于人的成本。同时我们刚刚说了,计算机的记忆力、运算力、处理能力远超过人类的。
所以我们讲在初期的文字处理领域,计算机的能力可以超过人类。所以很多行业里面有越来越多的基础性的文字处理工作可以交给计算机完成,让劳动力释放出来,可以做更多更有创造更有价值的工作。
达观用深度网络神经技术,能够像人一样去解读语句。比如:小明去达观数据开会。这句话我们把它输入到我们的双向的神经网络里面,让神经网络理解,它理解这句话哪个是主语哪个是谓语,然后去自动化进行文字处理工作。
我们的分析挖掘大致在三个阶段,先理解每个词的意思,再理解每个句子的意思,最后再理解文章的意思。我们随便贴个文本,计算机可以瞬间对于字词进行切分,可以自动的分析出来,哪个是动词哪个是名词,哪个是形容词,哪个是副词。进行字词级别的拆解,拆解完了之后,可以识别出哪个是人名哪个是地名哪个是关键要素。如果是个合同的话,可以拆解出合同的信息。
达观的数据系统也可以对文档进行简写。能把一万字的报告简写成两百字三百字;提取出文章里面的核心观点或者用户对于这篇文章的意见;可以给文章进行大标签,自动分析情感是正面还是负面的。进行文章内容的审核判断。
目前,达观已经在很多的大型企业里面落地了我们实实在在的应用系统,以数据来量化的话,一台计算机能抵得上95%的人工能力。目前达观以TO B为主,平均年单价超过百万元,2017年已经实现盈亏平衡,未来将会兼顾C端。
我觉得十年以后,在文字的处理工作方面,有一半的工作都会由计算机来代替人类完成。机械性的重复性的工作,我们觉得计算机的能力会超过人类。同时,未来大型的政企机构都一定会配备计算机软件系统代替人来进行文字的处理。我们也期待达观能够成为中文的自动化处理领军企业。
总结一下,我们觉得计算机来进行文字处理能四句话来解释。第一,千层网络,也就是深度神经网络,模拟人脑进行文字的阅读理解。
第二,万卷诗书,我们让计算机阅读过海量的文章之后,它能够理解这些文章的含义,它能够建立起语言的模型,就能代替我们工作。
第三,寒暑相推,我们的系统要不断的迭代进化,让它的能力一点点的提升,进而能达到人类的水平。
第四,而岁成焉,最后实现一个非常强大,非常有能力的系统。