而很快,01就生成了一系列的代码。
周岩下载了《斗破苍穹》的小说文本,对这段代码进行验证,很快就得到了不错的数据,虽然不全面,但显然这个项目是能进行下去的。
周岩又对这段代码提出改进要求,包括词频可视化,把词频用云图展现出来,包括对词频进行文本训练,从而找出词与词之间的关联。
这一回周岩提出的要求是对两本文本进行处理,两本分别是金庸老爷子的《神雕侠侣》和《射雕英雄传》。
很快01给出了相应的代码修改,周岩复制粘贴之后,进行测试。
其实需求也特别简单,就是找主角之间的人物关系。
杨过对应小龙女,那么郭靖对应什么,结果:黄蓉。
周岩又找了杨过和郭靖分别对应的关联词,同时让01局限在人物身上,自己设计一个人物词判定代码。
这一回01终于出现了一点错误,比如人物切分上面,会把4个词的人物变成2个词输出。
这就是细节上的毛病了,周岩现在也不是算法小白,知道怎么改进,不过周岩更期待01给出的结果。
于是他把这个问题粘贴给了01,而01也给出了对词频进行判定,如果两个拆分的词同时出现多次,那么判定两个拆分的词合并成为同一个词,并在字典中删除前面两个拆分词,并对已经分词好的数据进行处理,合并两个拆分词,没有分词好的就以该拆分词作为分词依据,照着分词就行。
粘贴进去以后,周岩发现效果意外的不错。
只是之后人物判别上也出现了一些问题,会把武器什么的加进去。
周岩又去问01,01回答了一些代码修改,但加进去以后,依旧是老样子,没法做到细致的划分。
周岩问01有没有什么好的办法,01说在处理之前,就把处理的小说人物给预设出来,这样就不会出现之后判定错误的情况。
也就是从源头解决问题,同样也算是一件很机械的处理方式。
但是人类有时候的处理,同样很机械,而且也是填鸭式的,就比如基因测序。
所以对于这一点也没办法太过要求什么,01做到这个程度,其实已经挺不错了。
周岩又预设了几个小型项目,并对01进行测试。
终于周岩也得出了一个结论。
那就是01已经具备了较复杂的代码作业能力。
更加专业的周岩自身实力有限,测试不出来,不过这个01用来应付小白显然没有什么问题。
测试完代码,
周岩又测试01的文本完整度,比如让01自己按照要求写一段话,要求包含出现的人物,以及事件,并呈现给他01思考的过程。
做这个的目的,周岩也希望能从中找到女黑客编写的算法逻辑。
而因为对周岩不设门槛,01也呈现出他的思路,包括对事件进行拆分,进行排序,然后进行扩充。
这样就得到了所谓的人物行为序列。
具体的就是是这样:
a干了干什么,a干了什么导致b干了什么。
b说了什么,a说了什么。
b干了什么,b干什么导致c干了什么。
a说了什么。
b干了什么。
a说了什么...
大概就是这样。
然后对这些句子进行组合,通过自然语言处理进行更进一步的润色,比如宾状补之类的词义补充,就得到了最终的句子。
周岩其实也明白,后来智能对话模型之所以那么火,其本质原因还是不对外界呈现出相应的步骤。
相当于黑箱效应,这样就给人一种不明觉厉的感觉。
很神秘,也很厉害,也因此受到很多人追捧!
但这样的处理方式,本身就存在很大的操作(糊弄)空间。
如果你询问的是百科类的知识,人家早早就已经准备好了文本库,你问什么答什么,本质上还是搜索引擎的功能。
如果询问的是算法,同样,如果能拥有世界上所有算法的集合,那么对一些基本问题,智能模型甚至根本不需要调动自己的算力,直接就能给出答案。
这跟查字典真的没有什么本质的区别。
周岩真正想做的,其实是让机器理解人类的需求,从而实现文本到图片、到声音、到视频的跨越。
真正实现智能模型和工具的联动,拓宽智能模型的应用场景。
试想说出了什么指令,虚拟现实机器立刻给你呈现出相应的画面,甚至你的行为还能被判定,从而和画面进行对等交互,那呈现出来的效果,也将会是无比炸裂的。
就比如,涩涩电影,实景交互,前世里岛国就有发展这一方面的业务。
而人工智能,绝对能把这个业务推向一个新的高度。
索性四下无人,周岩于是让01生成一段涩涩描写,要求不少于三百字。
于是01在短暂的思考之后,很快就生成了大段大段的文字。
而其中的内容,更是有点儿...刺激。
01是不懂遮掩的,也不懂尺度的,所以呈现出来的,就是互联网上最原始的描写,但就是这样赤裸裸的描写、堆叠的文字组合,就有种特别的风格和韵味在里面。
哪怕文字的处理方面,依旧有点儿机械,但总体的需求,显然是能够得到满足的。
周岩甚至看这段文字。
冷静了一会儿,周岩又打开了01的说明书看了起来,里面显然是女黑客对01做出的修改注释和一些补充,而周岩也发现了01逻辑性变强的原因。
女黑客加入了一系列的数学方法,比如离散数学、递归、线性代数的理论,这些理论让文字的逻辑性得到加强,同时不容易出错。
换句话说,就是把文字关进了逻辑的框架内。
说起来这个女黑客数学水平真不是概的,哪怕周岩系统性的学过数学理论,但在应用方面,还真没这个女黑客厉害。
显然她就是曾经算法老师口中的‘别人家孩子’,能够把数学和算法活学活用起来。
一般像这种人才,985高校的计院,基本都是抢着要的。
更不要说当时在进攻逐浪家园app的时候,这个女黑客能和张龙和顾远中等老牌程序员杀的你来我往,进退自如。
要知道顾远中的团队以前是专门做安全防火墙的,结果面对女黑客的时候依旧抓不到她的尾巴,已经足以说明问题。
周岩动了招揽的意思。
他打开了和女黑客的聊天窗,发了条消息过去。
秦雨诺这会儿正在浙大创业基地,属于建邺大学的队伍办公室里,操作着电脑。
她喜欢安静,也因此团队给她分配了一间独立的办公室。
周先生:【01我看了,改的挺好的。】
秦雨诺看到周岩的消息,回道:【还是有些不完善的地方,不过我之前也说了,这不是一个人的项目,你如果想要更加完善,需要组建一个团队,对智能模型进行长时间的训练。】
周先生:【杭城有一个4G试点基地,你听说过吗?】
秦雨诺微微抿嘴,4G的消息她关注过,也知道正在进行全国试点,不过大多都是在沿海城市进行,就像杭城就有一个。
她回道:【听说过,但没了解过。】
周先生:【你觉得这个智能模型最好的应用场景在哪里?】
倒考起她了。
秦雨诺:【手机。】
这就是最为正确的答案,手机的便携性可以最大发挥出这种问答模型的作用,甚至如果数据库吸收的足够多,可以给任何分类提供相应的指南。
如果能做到细化,旅行、教育等都可以做进一步的发散。
周先生:【代码的应用场景,不是应该适合电脑吗?】
秦雨诺直接回复:【比较鸡肋,目前根本做不到大型算法的自运行,只能完成或者回答一些小问题,对于专业性的人来说,顶多就是一款debug和注释工具。】
周先生:【如果是手机的话,你觉得什么类型的应用适合承载这一款产品?】
秦雨诺微微皱起好看的眉毛,她歪了歪脑袋,没有立刻回答周岩。
所以,他,不会把她当成问答模型了吧。
第833章 你污就行,别带坏我
最后迫于心里的那么一点无奈。
秦雨诺还是仔细想了想,才回答道:【可以直接做一个问答型app,慢慢积累粉丝,不过变现可能会比较困难,因为你如果要保证答案的严谨性和科学性,你就没办法像百度一样收钱给广告位,不过等你门类变多,用户积累起来以后,转型做电商也不是不可以。】
周岩知道女黑客想要表达的意思。
无非就是拆分成多个功能太过于鸡肋,还不如放在一起,做一个综合性问答软件。
可这问答软件...会不会和知乎撞上啊。
就比如你这个01智能模型可以和爬虫算法结合起来,像头条的张一明爬取互联网上有价值的新闻一样,你也可以爬取互联网上有价值的答案。
这其中有很大的上升和发展空间。
如果知乎是,提出问题,专家回答的话,那周岩做出的这款软件,就是提出问题,大数据来回答的模式,同样和百度类似,但百度的答案怎么说呢,越来越不靠谱,这也没法去改进什么,毕竟人家就是吃广告费起家的,如果让百度放弃广告费,相当于直接把百度腰斩,显然这并不是李总裁愿意看到的。
百度现在依旧是BAT的龙头巨无霸,距离百度落幕,还得等上两三年时间,你在这个时候告诉人家,你们的产品是昧着良心挣钱的,要停下来,怕是得被当成傻子给轰出去。
其实如果真的做问答模型也不是不可以,不过单一的问答显然也没什么意思。
周岩摸了摸下巴,他觉得完全可以把小红书那一套照搬过来。
完善分类,建立一个论坛,每个人畅所欲言发表笔记,然后智能模型提供优质答案,同时又不省略掉其他用户的回答,给提出问题的用户一个合理的选择空间。
就比如你要找房子购买,那么房子考虑的要素是不是可以贴出来,通过智能模型回答,然后在下面分享一系列的找房避雷帖、经验帖,显然会有一大堆人买账。
还有考研的,你先给一个人家一个标准答案,然后再来一些参考答案,同样一堆人买账。
而且设计一下评分功能,让标准答案越来越标准,让参考答案越来越受追捧,垃圾答案因为评分低自动跌落,保证的产品的正确性,标准性,严谨性,如果真的有越来越多的人愿意自发参与这样的生态构建中,甚至有机会做出小红书和知乎结合的软件。
既严谨正确,又不失趣味。
要知道小红书的一个缺点,就是男女用户不均衡,女性用户太多,堪称微博第二,同时还很爱炫富,把别人的图片拿过来凡尔赛,风向不对劲。
而知乎的缺点,则是公知太多,智障言论太多,在一开始走专家路线之后又迅速转型走大众路线,走量不走心,这也是知乎没有彻底发展起来的原因。
相比起来,由带货起家的小红书,反而发展的有声有色的。
只不过如果真的做这样的产品,势必会和知乎撞上。
甚至如果在知乎绑定一个01,到时候别人找他提问用01回答,会不会很有意思。
于是周岩又发了条消息过去。
周先生:【知乎你知道不?】
“知乎?”
秦雨诺微微愣了一下,她还真没了解过。