田亮:用科技力量打破语言巴别塔
进入2020年,“新基建”成了一个家喻户晓的热词。以人工智能、云计算、区块链等为代表的新技术基础设施,正在与各行各业深度融合,突破供需物理限制、产业行业边界,优化配置要素资源,有效拓展数据应用的广度和深度。
回想三年前的2017年5月14日,国家主席习近平在“一带一路”国际合作高峰论坛开幕式上发表主旨演讲时强调,“要将‘一带一路’建成创新之路,创新是推动发展的重要力量。要坚持创新驱动发展,加强在数字经济、人工智能、纳米技术、量子计算机等前沿领域合作,推动大数据、云计算、智慧城市建设,连接成21世纪的数字丝绸之路”。
具有深远意义的“一带一路”倡议,涉及俄罗斯、印度、泰国等60多个国家,近40亿人口,40多种语言,这就需要大量的翻译与语言服务,而完全依赖传统的人工翻译将无法满足“一带一路”赋予中国文化国际传播的语言服务重任。同时,随着国内各行业的蓬勃发展,促使对外交流、对外经济合作不断扩展,翻译市场对于经济、科技、法律、商务、赛事等翻译的需求也在越来越多,中国现有的翻译人才规模无法满足各行各业日渐增多的翻译需求。
智能翻译价值不断凸显
智能翻译系统相比于人工翻译,可涵盖多领域、多行业的海量词典和翻译模型,可在不同场景下进行翻译,为人们生活带来各种便利。
人们可以通过智能翻译,解决衣食住行中遇到的语言难题。小到出国旅游、科技文献翻译,大到国际贸易、跨语言文化交流……多语言信息联通需求,彰显智能翻译的重要价值。
此外,随着人工智能技术、神经网络翻译等新技术的快速发展,智能翻译也完成了从传统基于统计的智能翻译到基于神经网络的智能翻译的变革,智能翻译走向日常运用成为可能。
2006年以来,以深度学习为代表的机器学习算法在机器视觉和语音识别领域取得了极大成功。2017年开始,机器翻译在神经网络模型的算法下,准确性大幅提升,使人工智能再次受到学术界和产业界的广泛关注。云计算、大数据等基础层技术在提升运算速度,降低计算成本的同时,也为人工智能发展提供了丰富的数据资源,协助训练出更加智能化的算法模型。
事实上,人工智能不仅仅涉及语音、图像的领域,还包括文本方向。人工智能文本方向,两个典型的应用是搜索引擎和机器翻译,搜索引擎已经造就了谷歌、微软、Naver、百度和搜狗等巨头,当前机器翻译被认为是人工智能下一个最能落地的人工智能技术。从人工智能发展规模看,当前主要集中在数据标记、语音识别、语义识别、计算机视觉等技术领域以及安防、医疗、金融等应用场景,而智能翻译技术及应用还处于爆发应用的前夜,是未来一段时间必争的技术点和创新点。
缘起澳大学习 情定文本领域
当前以搜索引擎和机器翻译技术为代表的人工智能文本领域得到了学术界、产业界和资本的重视,但是在2009年的时候这一领域还是乏人问津的。这一年,谷歌在德国科学家Franz Josef Och的带领下发布了统计机器翻译并且商用,但无论学术界和产业界如何努力,在翻译的可读性上就一直没有达到令人满意的程度。
而正是这一年,我进入澳门大学读研,研究的领域方向就是机器翻译。记得当时我还跟导师还开玩笑:“语音识别当前做的人多,算法相对成熟,我跟几个同学选择这个领域,可能毕业后都找不到工作,除非我们运气爆棚,机器翻译真的迎来大的算法变革。”事实上,直到2015年,这个专业毕业的学生,就业路径还是很窄的。时间过得真快,从2013年至今,我毕业已经7年。回过头来看,正是在澳大的学习经历以及当年学校给予我的多次海外交流机会,促成了我后来的创业。
2009年8月,我选择进入澳大自然语言处理与葡中智能翻译实验室(NLP2CT)。实验室的生活紧张而快乐,十几个师兄弟在导师黄辉和葡萄牙里斯本、卡耐基梅隆大学的Isabel Trancoso指导下,做实验、写论文、赶比赛,每年还要出国去参加国际论文会议和其他实验室的交流。连续五年的科研生涯,也为我以后跟实验室几个师兄弟创业准备好了理论和技术基础。
当时,有几件事情对我走上创业之路有比较大的影响。其一,实验室每周的成果进度汇报,既锻炼了我的演讲能力,也逼着我形成善于总结的能力和习惯。其二,每年的多地实验室合作交流机会,开拓了我的视野,也为如今我与各个机构开展合作打下了良好基础。其三,2011年到2012年在葡萄牙里斯本的机器学习夏令营,我有幸听到谷歌大牛Jeff Dean关于机器翻译的阐述,加深了我对机器翻译这个行业前景的认同,也了解到其能够真实地应用于专利、新闻出版、会议等场景(现在知道,当时的谷歌已经研制神经网络模型,找到可能会出现巨大变革的机会)。其四,澳大完善的体育锻炼措施,每周至少五天坚持不断跑步,让我不服输、坚持做的心态得以加强。要知道,创业本来就是九死一生的事,没有强大的内心是无法坚持下来的。我一直相信,今日的苦果是昨日的伏笔,当下的付出是明日的花开。
2014年12月,我走上了创业的道路。如今,新译科技及其研发的智能翻译产品得到了不少资本机构上亿元资金的支持,也斩获了多个国家级奖项。想起研究生二年级在葡萄牙交流的时候,为了跟一位外国伙伴在万米比赛中一争高低,最后自己在跑道上晕倒的囧事,不禁感慨自己当时“也是拼了”。对我而言,一切的努力、斗志,不服输和坚持不懈,都离不开澳大之根。
当然,创业过程中我也逐渐认识到学术研究和商业落地还是两码事,不能仅仅凭借一腔热血。
语言作为文化及价值观的载体,是赢得未来角逐赛中的主角。突破语言障碍沟通,不仅是全球化发展的需求,更是构建人类命运共同体的基础支撑。目前中国传统语言服务市场规模约350亿元,潜在市场需求超过2000亿元,预计到2030年全球市场将达到万亿元规模,市场空间巨大且呈现快速增长态势。可以说,语言能力是国家硬实力,也是比传统基建更有战略价值的“新基建”。而这一切都离不开最核心的技术底层——机器翻译等技术加持。
聚焦沟通无障碍体系 打破语言巴别塔
2015年至2017年,借助市场的开拓和股东方的资源,新译科技不断承接项目,营收规模日益扩大。但是这些并未令我满足,每年我都在思考,究竟什么时候才能找到不断规模化复制的突破点?有句行话说,做B端业务的企业都有一个做C端的梦,希望让自己的产品家喻户晓。不过我最终还是定位在先把B端业务做精,通过构建一个翻译生态体系,把机器翻译、语言资产和生产工具有效地集成,满足上下游客户的需求。
技术的发展推动语言服务行业新商业模式的探索。机器翻译、语音识别、图像识别等人工智能技术、社交媒体和协同技术的发展将影响翻译服务产业链的交互模式,带来新的挑战和机会。新译智能编辑平台是一款基于云计算环境的软件系统,能够将翻译人才和需求方连接在一起,并促成合作,进而提升需求方应用程序功能性和质量性需求,能够满足公司(包括翻译公司)和自由译员的翻译工作流程需求。因此,它的定位较为多元,既是一款计算机辅助翻译软件,又是全球化管理软件和外包平台。
新译智能编辑平台直接连接翻译需求方,为其提供高质量、高效率、低成本的翻译服务。
从工作流程上看,新译智能编辑平台主要涉及8种文件内容的翻译编辑工作,主要包括文本文档编辑中的文字翻译、文档翻译、字幕翻译(如SRT文件)等不同格式的翻译,主要解决的是笔译内容;音视频编辑主要涉及音频听写、视频听写、音频翻译、视频翻译、会议同传的转写和翻译服务,主要解决的是口译内容;图像编辑主要包括带有图片格式的文本和视频翻译,所以在软件设计中可以归于文本和音视频类别中。
新译智能编辑平台处理文件内容分类
从平台特点来看,新译智能编辑平台能够轻松地通过项目API嫁接需求方的应用产品,包括新闻采编系统、出版社图书系统、CMS、ECM、EDM、SVN、OA等中自动传输翻译文件。换句话来讲,只要用户把这类翻译(标注)任务传递过来,智能编辑平台就能帮助完成相应工作。久而久之,新译智能编辑平台完成各种数据的积累,就能通过大数据分析提供更精准的智能翻译。
同时,通过各垂直领域的数据积累,可以构建更多的垂直应用场景,包括媒体会议场景、翻译旅游场景、会议场景和教育场景等。通过多个维度的不断打磨,可以在多语言、多领域构建人机协作平台,达到即时性高质量输出,满足生产和生活需求。
作者简介
田亮,男,1986年出生,澳门大学博士,主攻自然语言处理机器翻译课题研究,现为新译信息科技(北京)有限公司和新译信息科技(深圳)有限公司CEO。澳门大学求学期间先后发表SCI期刊1篇、国际会议论文9篇,取得发明专利7项和机器翻译相关软著6个,2012年获得澳门科学技术奖二等奖。2017年10月,田亮带领的团队荣获人工智能最高奖——吴文俊人工智能奖。2018年8月,田亮成为北京市第十三批“海聚工程”入选专家。
推荐文章
- 2024-03-012024年“海归三秦领航者”计划——海外人才推荐工作启动
- 2024-07-152024年陕西省级人才计划申报推荐工作启动
- 2024-09-06陕西省欧美同学会2023年度部门决算
- 2022-10-09陕西省欧美同学会新会员名单公示(第5批次)
- 2024-09-252024年全球秦商大会“校友回归·助陕发展”专场活动举行
- 2024-07-22陕西留学人员热议党的二十届三中全会精神(二)
- 2024-07-24陕西留学人员热议党的二十大三中全会精神(三)
- 2024-06-18关于集中开展留学人员登记工作的通知
- 2024-06-27西安思源学院欧美同学会(西安思源学院留学人员联谊会)成立大会召开
- 2022-10-18陕西留学人员热议党的二十大胜利开幕(一)