说的人觉得挺有趣,说完还哈哈哈的笑。
安夏却从中想到了另一个的问题。
被那个贼偷走的书都是珍本,借阅都有门槛,属于想看的人看不到,有资格看的人不一定会去看。
随着时间的流逝,这些珍本也许本身会损坏,纸张变脆,字迹消失……那就太可惜了。
到时候,许多书也许就会出现大量丢字的情况。
后人都不知道那些字到底是犯了谁的忌讳变成的「口口」,还是当初出土的时候本身就是「口口」。
刚好此时在首都,安夏找到相关的门,以美国的窃书贼案为由头,问他们是否打算把珍本善本孤本也电子化,方便保存和。
“想啊,但是扫描下来变成图,一张就占特别多的位置,我们现在只存了几本书,就已经挤满了十个硬盘。”
安夏问道:“我们公司的扫描技术已经可以把图里的字扫出来了呀。”
“用过了,能扫出来的只有印刷体,连行书都识别不了,古籍上的许多字上都有划痕,系统更认不出来了。”
难怪字体提取功能上线之后,免费版和收费版都跑得不行,没有出息的项目组以为这个功能过于超前,所以无人使用。
又因为他们甚至都没做客户登记,连这个功能到底有哪些单位在用都不知道。
最后散伙的时候,项目经理还发了一封公开信,大意就是:
世间皆是俗人,把吴钩看了,栏杆拍遍,无人会,登临意。
那时安夏也没空盯他们这个小项目,就随他们自由发挥。
哪个公司还不死几个项目的,习惯就好。
如今她才知道,扫描提字项目组的倒闭不是技术不行,是意识不行……
安夏自我安慰:算了,五根手指伸出来还有长有短,不能指望全公司上下全都是人精,再牛逼的公司也有翻车的时候。
记得这个项目组的一部分人辞职走了,另一部分人转行投奔了电子辞典的升级版。
安夏看了几篇古文原稿,发现肉眼识别的话,问题不大,正经流传下来的书籍和书信一般不用狂草。
最多就是有点扭动,有点划痕。
有一种熟悉的感觉。
安夏想起了验证码……各种登陆的时候,发言的时候,需要输入的中文、英文,还有识别图形。
人工智能,需要大量的人工对其进行引导。
人类在用肉眼识别图片,并输入正确字符的时候,就是对人工智能的一个驯化过程。
“能不能把比较难识别的一些古本扫描图给我们,我们会让计算机学会识别这些字的。”
“计算机?识别这些字?”古文专家觉得安夏在说天方夜谭。
“是像《编辑部的故事》里那个人工智能一样吗?”
安夏笑道:“不一样,那个人工智能是人装的,我们这是真正的计算机人工智能。”
“它要怎么识字?”古文专家还是想不通。
安夏跟他说了一通算法、线性回归、计算树以及等等……古文专家露出安夏与阿昕聊天时,听「转录、变异、xx链」的表情。
最后他的反应也是安夏熟悉的:“啊——原来是这样!太厉害了,那我就期待着你们的好消息。”
自从年会的时候,安夏当众宣布,要无条件支持人工智能项目组的时候,技术总监心里又感动,又有压力。
老板这么给面子,要是不干出点样子来,怎么对得起老板的信任?
之前都是基础研发,现在一下子就来了两个大活,通过活人的行为对计算机数据进行引导。
安夏把他叫到办公室:“根据你的判断,大概要喂多久的资源,识别字体才能略有成就?”
“大概要……”他犹豫了一下,大胆的报了一个数:“如果按照现在计算机的使用人数增长率来看,可能需要十年。”
十年,人生有多少个十年。
他心里忐忑不安。
“嗯……”安夏点点头,计算机硬件价格现在还居高不下,大城市的人均拥有量都不高,远还没有到大幅增加的时候。
从现在就开始囤数据,不至于等十年,以后人工智障应该学会自己把划痕去掉了吧?大概。
数据收集急不得。
安夏收到一封来自美国的陌生邮件,自称他们看到了《村庄守卫者》和《王国破坏者》,认为这两款游戏非常有意思,非常有市场竞争力,他们希望可以参与投资。
“又是一家投资公司吗?”
安夏找人打听了一下,发现确实有这么一个公司,没什么名气,好像是某大学名下研究计算机的部门。
安夏拒绝了他们。
理由很简单:从各种方面来看,他们很穷。
她需要有一个稳定的投资人,不是投一轮,就把自己给投倒闭了。
这样会影响紫金后面的生产计划。