我们离真正的开源人工智能还有很长的路要走 - FT中文网
登录×
电子邮件/用户名
密码
记住我
请输入邮箱和密码进行绑定操作:
请输入手机号码,通过短信验证(目前仅支持中国大陆地区的手机号):
请您阅读我们的用户注册协议隐私权保护政策,点击下方按钮即视为您接受。
FT商学院

我们离真正的开源人工智能还有很长的路要走

沃特斯:目前的开源人工智能并非真正的开源,如果用户无法看到模型的基础数据,就无法自由地复制这些模型。
00:00

{"text":[[{"start":null,"text":"

Meta的Llama 3:用户可以使用和调整模型,但他们看不到训练模型的基础数据,也没有足够的信息从头开始复制模型。
"}],[{"start":7.45,"text":"开源人工智能是过去一年最令人惊讶的科技故事之一。"},{"start":12,"text":"随着OpenAI和谷歌(Google)等公司投入数十亿美元打造更强大的人工智能,开发人员可以免费使用和调整的“开源”模型缩小了性能差距。"}],[{"start":22.45,"text":"但有一个缺点:大多数开源系统并不十分开源。"},{"start":26.48,"text":"批评者指责它们的支持者“开源洗白”——试图从开源的光环效应中获益,摆脱普通商业软件产品的束缚,但却名不副实。"}],[{"start":36.19,"text":"创造真正开源版人工智能的努力终于获得了动力。"},{"start":40.209999999999994,"text":"但谁也不能保证其进展能与过去20年在科技界发挥了关键作用的开源软件相媲美。"},{"start":46.949999999999996,"text":"传统的开源软件,如Linux操作系统,代码是免费提供给开发人员检查、使用和调整的。"},{"start":54.62,"text":"所谓的开源人工智能则截然不同,这主要是因为大多数现代人工智能系统都是从数据中学习,而不是用代码编程逻辑。"}],[{"start":64.31,"text":"以Meta的Llama为例。"},{"start":66.14,"text":"只有决定模型如何响应查询的“权重”是公开的。"},{"start":69.89,"text":"用户可以使用并调整它,但他们看不到训练它的基础数据,也没有足够的信息从头开始复制该模型。"}],[{"start":78.05,"text":"对于许多开发人员来说,这仍然有一些明显的好处。"},{"start":82.12,"text":"他们可以根据自己的信息调整和训练准开源模型,而无需将敏感的内部数据交给另一家公司。"}],[{"start":89.38000000000001,"text":"但不完全开源是有代价的。"},{"start":91.95,"text":"Mozilla基金会高级顾问阿亚•贝迪拉(Ayah Bdeir)表示,只有真正的开源技术才能让人们全面了解那些开始影响我们生活方方面面的系统,同时也能保证创新和竞争不会被少数几家占主导地位的人工智能公司扼杀。"}],[{"start":107.28,"text":"其中一个回应来自开源促进会(Open Source Initiative)——它在20多年前就给出了开源软件的定义。"},{"start":113.4,"text":"本周,它给出了一个接近最终的定义,可能有助于塑造该领域的发展方向。"}],[{"start":119.29,"text":"这不仅需要公开模型的权重,还需要公开关于训练模型的数据的足够信息,以便其他人复制模型,以及系统背后的所有代码。"},{"start":128.63,"text":"Mozilla和Linux Foundation等其他组织也在推动类似的举措。"}],[{"start":133.53,"text":"诸如此类的举措已经导致人工智能领域出现了更大的细分。"},{"start":138.18,"text":"许多公司在使用术语时更加谨慎——也许是考虑到开源促进会拥有“开源”一词的商标,并可能提起诉讼,以防止该词被用于自己定义之外的人工智能模型。"},{"start":150.12,"text":"例如,Mistral将其Nemo称为“开放权重”模型。"}],[{"start":154.16,"text":"除了部分开源的系统,完全开源的模型也开始出现,比如Allen Institute for AI开发的大型语言模型Olmo。"},{"start":162.68,"text":"然而,这个版本在人工智能领域是否会像在传统软件领域那样产生巨大影响,目前还远不清楚。"},{"start":170.63,"text":"要做到这一点,需要满足两个条件。"}],[{"start":173.62,"text":"首先,这项技术需要满足足够大的需求,以吸引大量的用户和开发人员。"},{"start":179.74,"text":"在传统软件方面,Linux服务器操作系统显然是微软Windows的替代品,为其赢得了大量用户,并得到了包括IBM和甲骨文(Oracle)在内的微软竞争对手的大力支持。"},{"start":192.36,"text":"在人工智能领域,Linux没有类似存在。"},{"start":195.87,"text":"市场已经变得更加分散,许多用户会发现像Llama这样的准开源大型语言模型已经足够了。"}],[{"start":203.09,"text":"开源人工智能的支持者也需要更好地证明其安全性。"},{"start":207.3,"text":"这种强大的通用技术被发布供任何人正确使用的前景引起了广泛关注。"}],[{"start":213.05,"text":"Allen Institute前所长奥伦•埃齐奥尼(Oren Etzioni)表示,许多担忧被夸大了。"},{"start":218.17000000000002,"text":"当谈到在线研究如何制造炸弹或生物武器时:“你真的无法从这些(人工智能模型)中获得比谷歌上更多的东西。"},{"start":226.99,"text":"市面上有很多这样的东西,只是包装不同而已。”"},{"start":230.79000000000002,"text":"他承认,在某些领域,更自由地使用人工智能可能会造成伤害,比如自动创造更多的在线错误信息。"}],[{"start":239.04000000000002,"text":"“闭源”人工智能也有风险。"},{"start":241.31000000000003,"text":"但是,除非更彻底地研究了开源技术的额外边际风险,以及潜在的好处,否则担忧仍将存在。"}]],"url":"https://creatives.ftacademy.cn/album/168559-cn-1724375808.mp3"}

版权声明:本文版权归FT中文网所有,未经允许任何单位或个人不得转载,复制或以任何其他方式使用本文全部或部分,侵权必究。
设置字号×
最小
较小
默认
较大
最大
分享×