第一千四百六十八章:AI忧虑 (第3/3页)
后研究如何让计算机从数据中进行深度、有效的学习。
建立一个肯定不是最优秀,但绝对是你现阶段可以拿出来的最好模型,对新数据进行预测,诊断、分类。
建立一个你独自研发的人工神经网络来模拟你认为的人类大脑学习过程,让AI模型也参与其中,自动学习复杂的特征,并从大量的数据中抽取有用信息,从而实现高精度的预测。
当然,我们公司在这个环节可以给你提供大量国内外服务器的优秀数据让你进行模型训练,但是你要自己选择方法。
需要注意的事,训练数据的质量和数量对模型训练结果有极大影响,因此在选择数据源时,需要仔细考虑它的质量和数量,以确保模型训练得到的是有效和准确的结果。
另外,你要做的是一个智能AI程序,所以模型不能单一,训练数据的分布和平衡也不能单一失衡。
如果数据在各行业的表现上分布失衡,例如语言分类中,脏话、俚语、违规发言、阴阳怪气词汇过多,模型必定会跑偏,甚至被垃圾数据污染,到时候你还得做心理医生,来处理进化出现问题的智能AI程序。”
说道这个注意事项的时候,顾青的表情有些不正常。
这时候,智能AI玄武不知道为什么突然触碰到了一段“奇葩”数据。
“好的,先生。已经更新设定集。”
“等下,把你目前的个性设定集放到我手机上来。”
“好的,先生。”
御-姐、luo莉、zheng太、性格强气而又傲娇的有钱高中生大小姐迫于教养的压力不得不装出温柔的da和-抚zi,这种奇奇怪怪的设定。
“你这到底是学习了些什么啊?”
“暂时就保持这个管家设定,别再给我添加什么奇葩设定,还有日-韩的资料,除了科技和安全方面的数据信息,其他的统统给我过滤掉,下次再让我看到你有奇怪的设定,我就要再优化下你的逻辑程序了。”
——
不知道是不是因为顾青是玄武的创造者,顾青此时也是同步想起了这段黑历史。
自家的老实、忠厚管家AI,差点就被互联网当中的某些“垃圾”数据,给污染成了坏AI,如果不是他察觉及时,赶紧堵住了口子,后面又优化了几次玄武的逻辑程序,不然还真的可能被“垃圾”数据给打败。
九州科技隐藏最深的强大AI,可能就是獬豸了……
也或许正是因为玄武诞生和成长的时候遇到了这些问题,所以顾青研发獬豸的时候,对AI程序的逻辑程序可是耗费了不少精力,这才将獬豸打造成了法务部门的得力助手,不愧于“獬豸”之名的强大AI程序。
在失神了片刻之后,顾青继续对张本煜说道:“要想使模型的训练得到你需要的最好结果,你必须要每天抽出三个小时以上的时间,对训练数据进行耐心且细致的选择、清洗和重要标注,并对数据进行有效的分割和分布,以确保模型具有良好的泛化能力。
AI开发平台这个暂时就不需要你自研了,我们九州科技研究部门内部就有一个AI平台,只不过一直没怎么对你们开发,也是害怕你们用这个平台做出一些危害性的AI程序。
但是你今天可以使用它,这个AI平台可以帮助开发人员训练、部署和管理AI模型,并且还提供了一些超算的计算资源,可以有效加速模型的训练和评估。
不过你要记住一个原则,那就是强大的模型建构能力、高效的计算、完善的工具和文档这三个要素最好做出一些取舍,因为地基越是身后,AI的研发初期就越是困难,以后遇到的bug就越是难以处理。
不要去追求完美,因为完美本就是一个陷阱,追求有限度的尽善尽美就好。
我这里可以给你推荐几篇研究基地某几位院士、专家和某几个项目组的论文,相信它们会给你一些启发。”
顾青就像是一位无私的教师,耐心教导着已经有些偏执的青年天才。