每个人都对AIGC算法的方式感到惊讶,它可以产生任何风格的令人惊叹的艺术作品,然后立即用很棒的语法写出长篇文章。每个CIO和CEO都有一张或三张幻灯片,准备讨论AI将如何改变他们的业务。
这项技术仍处于初级阶段,但其能力已经不可否认。下一波计算将涉及AIGC,可能会出现在工作流程的几个地方,趋势将是势不可挡的。
有什么可能出错?嗯,很多事情。末日预言者想象着经济的彻底毁灭和人类的奴役。
即使最糟糕的情况永远不会出现,也不意味着一切都会完美。AIGC算法仍然非常新,发展迅速,但仍有可能在基础上看到缺陷。深入研究这些算法,你仍然会看到它们无法兑现的地方。
以下是AIGC算法的7个黑暗秘密,在计划如何将该技术整合到你的企业工作流程中时,请记住这些秘密。
01
它们凭空制造出错误来
大型语言模型撰写1000字的文章的方式几乎是神奇的,这些文章涉及一些晦涩的主题,比如沙鹤的交配仪式,或者17世纪东欧建筑中隆起的重要性。但同样的魔力也使他们能够无中生有地创造错误。他们正在游荡,用受过大学教育的英语专业学生的能力来搭配动词和语法。许多事实是完全正确的。然后,瞧,他们只是编造了一些东西,就像一个四年级的学生试图假装它一样。
大型语言模型的结构使这一点不可避免。他们使用概率来了解单词是如何组合在一起的。偶尔,这些数字会选择错误的词。没有真正的知识甚至本体论来指导他们。这只是机率,有时掷骰子会出问题。我们可能认为我们正在与一个新的上级生物融合在一起,但我们真的和拉斯维加斯的赌徒没有什么不同,在赌场上,我们在掷骰子的序列中寻找信号。
02
它们是数据筛子
人类试图创造一个复杂的知识层次结构,其中一些细节是内部人士知道的,一些是与每个人分享的。这种一厢情愿的等级制度在军方的分类系统中最为明显,但许多企业也有这种等级制度。对于IT部门和管理这些层次结构的CIO来说,维护这些层次结构通常是一件非常麻烦的事情。
大语言模型在这些分类方面做得不是很好。虽然计算机是终极规则的追随者,它们可以保存几乎无限复杂的目录,但大语言模型的结构实际上不允许某些细节保密,一些细节可供共享。这一切都是马尔可夫链上的概率和随机游动的巨大集合。
甚至还有令人毛骨悚然的时刻,大语言模型会利用其概率将两个事实粘合在一起,并推断出一些名义上秘密的事实。考虑到同样的细节,人类甚至可能会做同样的事情。
也许有一天,大语言模型能够保持强大的保密层,但就目前而言,这些系统最好是用非常公开的信息进行培训,如果它泄露了,不会引起轰动。已经有几个备受瞩目的例子涉及公司数据泄露和大语言模型护栏被绕过。一些公司正试图将AI变成一种阻止数据泄露的工具,但我们需要一段时间才能理解做到这一点的最佳方式。在此之前,CIO们可能会更好地对提供给他们的数据进行严格控制。
03
它们助长了懒惰
人类非常擅长信任机器,特别是在它们节省工作的情况下。当大语言模型在大多数情况下证明自己是正确的时,人类开始一直信任他们。
即使要求人类仔细检查AI,效果也不是很好。在人类习惯了AI是正确的之后,他们开始迷失方向,相信机器会是正确的。
这种懒惰开始充斥整个企业。人类停止为自己思考,最终企业陷入低能量停滞,没有人想要跳出框框思考。它可以放松和没有压力一段时间–直到竞争出现。
04
它们的真实成本是未知的
没有人知道使用大语言模型的正确费用。哦,有许多API的价格标签,详细说明了每个令牌的成本,但有一些迹象表明,这一金额得到了风险资本的大量补贴。我们看到,像优步这样的服务也发生了同样的事情。价格一直很低,直到投资者的钱用完了,然后价格飙升。
有一些迹象表明,目前的价格并不是最终将主导市场的真实价格。租用一个好的GPU并保持它的运行可能要昂贵得多。在本地运行大语言模型可以节省一点钱,方法是在机架上装满视频卡,但这样就失去了交钥匙服务的所有优势,比如只在你需要的时候才为机器付费。
05
它们是版权的噩梦
市场上已经有一些很好的大语言模型可以处理一般的家务,比如做高中作业或写大学入学论文,强调学生的独立性、干劲、写作能力和品德,还有他们独立思考的能力。
但大多数企业没有这些AI可以承担的一般性家务。他们需要为他们的特定业务定制结果。基本的大语言模型可以提供一个基础,但仍然需要大量的培训和微调。
几乎没有人想出了收集这些训练数据的最佳方法。一些企业很幸运,拥有他们控制的大数据集。然而,大多数人发现,他们并没有解决所有关于版权的法律问题(这里、这里和这里)。一些作者提起诉讼,因为他们没有得到关于使用他们的写作来训练AI的咨询。一些艺术家觉得自己被抄袭了。隐私问题仍在解决中(这里和这里)。
你能根据客户的数据训练你的AI吗?版权问题解决了吗?你有合适的法律形式吗?数据的格式是否正确?有如此多的问题阻碍了你创造一个伟大的、定制的AI,准备在你的企业中工作。
06
它们可能会被供应商锁定
从理论上讲,AI算法是一种泛化的工具,它已经抽象了用户界面的所有复杂性。他们应该是独立的,独立的,能够处理生活——或者他们所服务的白痴人类——抛给他们的方式。换句话说,作为一个API,它们不应该是僵化的。从理论上讲,这意味着快速更换供应商应该很容易,因为AI机构只是会适应。不需要一些程序员团队重写粘合代码,并在更换供应商时做所有会造成麻烦的事情。
然而,在现实中,仍然存在分歧。API可能很简单,但它们仍然存在差异,比如调用的JSON结构,但真正的不同之处隐藏在深层,为AIGC撰写提示是一种真正的艺术形式,AI并不容易让它们发挥最好的性能,已经有一份工作描述是给那些了解这些特质的聪明人的,他们能写出更好的提示,提供更好的答案,即使API的差异很小,提示结构中奇怪的差异也很难快速切换AI。
07
它们的智力仍然很浅
长期以来,对材料的随意熟悉和深刻而明智的理解之间的差距一直是大学里的一个主题。亚历山大·蒲柏曾写道:“学识浅薄是一件危险的事;要么深饮,要么就不要品尝皮埃尔的泉水。”那是在1709年。
其他聪明人也注意到了人类智力极限的类似问题。苏格拉底的结论是,就他所知道的一切而言,他真的一无所知。莎士比亚认为聪明人知道自己是个傻瓜。
清单很长,这些对认识论的见解大多以这样或那样的形式应用于AIGC的魔力,而且往往在更大程度上适用。CIO和技术领导团队面临着一项艰巨的挑战。他们需要充分利用生产性AI所能产生的最好效果,同时努力避免搁浅所有智力浅滩,这些浅滩长期以来一直是任何地方的智力的问题,无论是人类、外星人还是计算机。
出自:https://mp.weixin.qq.com/s/TtD1p7KuiGUjUUaV3gNlEQ