这些字儿也太太太太太太难认了,AI能不能拯救我?

  春节长假正式进入倒计时,各位小伙伴是不是已经盘算好了去哪里一浪?你是回到青山绿水的家乡被“催”,还是在灯红酒绿的都市里找“堵”?

  但要说这外出旅行,最尴尬的事情,“不认字”绝对是其中之一。

  这个“不认字”说的可不是日常使用的汉字,更不是“茕茕孑立,沆瀣一气,踽踽独行,醍醐灌顶”,毕竟咱都是受过教育(刷过抖音)的文化人。

  但是这名胜古迹、风景园林里的字实在是太难认,比如曾经爆红网络的我国书法界“四大奇观”:

这些字儿也太太太太太太难认了,AI能不能拯救我?

  被认成“采药超人”的“大道无为”......

https://tc.sinaimg.cn/maxwidth.2048/tc.service.weibo.com/photocdn_sohu_com/a5d2231c941a5b280707b5e4771c91bd.jpg

  明明是“宾至如归”,越看越像“妇女之宝”......

这些字儿也太太太太太太难认了,AI能不能拯救我?

  不是“坐月子”更不是“坐尺子”,而是“千人坐”!

https://timgsa.baidu.com/timg?image&quality=80&size=b9999_10000&sec=1548762820812&di=f5f30ba7949b9fca0873e4520f0da51c&imgtype=0&src=http%3A%2F%2Fwz.eyuyao.com%2Fupload%2Fcontent%2Fxheditor%2Fupload%2Fday_150408%2F201504080245467154.jpg

  到底是什么想象力,才能把“勤能补拙”误认成“杜甫能动”啊!

  如此看来,上到书法名家的亲笔提匾,下至自然景观的刻字石碑,书法的背景、字体都如此多样化,“认字”的人可能真没有几个。

  虽然你对这些字看不出个所以然,这届程序员们却get了“涨姿势”的新方法......

  前不久,2019 数字中国创新大赛全面开赛。华为作为大赛的出题方之一,提出了“文化传承——汉字书法多场景识别”的赛题。参赛者将进行AI模型训练与应用开发,实现书法字体的自动、实时、准确识别。

这些字儿也太太太太太太难认了,AI能不能拯救我?

  现如今人工智能技术发展迅猛,在手写中文识别方面也已经有了很大的突破。华为的技术工程师中也有书法爱好者,大家头脑风暴后提出了使用文字识别服务(OCR)来识别书法艺术这个赛题的想法。

  目前,华为云EI的文字识别服务(OCR)已应用到多个行业,实现信息高效精准的数字化。例如,在物流业,帮助德邦等物流公司识别快递单;在医疗业,帮助医疗机构识别各种医学化验单;在金融业,帮助保险公司识别各种保单等。

  此外,作为本次大赛的“兼任导师”,华为云还送给了选手们一款参赛必备神器 ——一站式AI开发平台ModelArts。ModelArts主打一站式、全流程、易用、高效、便捷……可以说是“AI开发者的福音”。

  为什么这么说?随便举个例子。早前,斯坦福大学最新公布的DAWNBenchmark成绩排名中,在图像识别(ResNet50-on-ImageNet,93%以上精度)的总训练时间上,ModelArts以9分22秒的成绩,拿下全球第一,大幅领先于其他选手。

  那ModelArts又是何方神圣?概括来说,它是华为云面向AI开发者最新推出的一站式全流程开发平台。具体来说,它可以提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流,可实现更低成本、更快速度、更极致的体验。

  对于行业以及开发人员来说,这个也不难理解。在华为云“普惠AI”的大旗之下,ModelArts也成为践行该理念的一把利器,真切地为AI开发者提供通往AI化的普惠之路。

  AI开发者之幸:将简单易用进行到底

  说了那么多,也是时候来体验一下这个以艺术之名,面向AI开发者的ModelArts真正的实力了。

  作为一个媒体工作者(开发小白),前段时间我也试图体验了一番这个简单易用的平台。

这些字儿也太太太太太太难认了,AI能不能拯救我?

  首先我们进入ModelArts官方首页,点击立即使用,就进入了看似高深,实则可以零门槛上手的体验过程。

这些字儿也太太太太太太难认了,AI能不能拯救我?

这些字儿也太太太太太太难认了,AI能不能拯救我?

  首次进入,我们会看到几组悬浮的指引提示,标注着各个功能板块。在自动学习模块,你无需写代码,只需要上传数据,自动学习的UI向导就能引导你完成数据标注,并且自动训练出高质量的模型。

  具体可分为上传数据>图片标注>自动训练>一键部署几大步骤。

  我们以图像分类,即识别一张图片中是否包含某种物体为例具体展开。

  最近某个大神级的人物在朋友圈分享了一句话,叫「你未看此花时,此花与汝心同归于寂;你来看此花时,则此花颜色一时明白起来。」颇有哲理,我们这次训练的目标就拿花来入手。

  此次训练我们无需丰富的数据集,只是因为在ModelArts的市场板块里已经备好多个强大的数据集供我们测试使用。

  在市场板块中,我们找到了诸多已经准备好的API、模型和数据集,其中就有一个名为“Flowers-Data-Set”的数据集,我们将其直接导入我的数据集,完成第一步数据准备工作。

这些字儿也太太太太太太难认了,AI能不能拯救我?

  值得一提的是,在整个过程中,都会有一份详细的堪称葵花宝典式的用户指南,详尽的阐释着每个细节。

  有了数据,下一步就到了训练模型环节,也就是训练作业。

这些字儿也太太太太太太难认了,AI能不能拯救我?

  作为新手,我们根据操作指南填写以上看似陌生的数据参数,填写完成后,点击创建即进入了训练的过程。

  我们注意到整个训练过程用时11分31秒。