作者: 币安app官方 日期:2024-11-27 08:21
撰文:Mario Gabriele,The Generist
编译: SevenUp DAO
人工智能是越来越有能力的媒体创造者。ChatGPT 是人工智能令人难以置信的能力的最新体现。模型可以写文章、写诗、生成图像和生成视频。
我们可能正在进入一个「媒体层出不穷」的时代。人工智能不仅是一个有能力的创造者,而且是一个即时的、经济的创造者。随着时间的推移,它可能会在各种媒介上达到或超过人类的能力,从而形成一个可以按需创作电影、漫画或小说的世界,无限次。
无尽的媒体可以增强现有 IP 的价值。特许经营主宰着我们的文化,尤其是在电影和电视领域。然而,大型特许经营商必须经常花费大笔资金才能使他们的最新分期付款栩栩如生。人工智能可以节省成本和时间,从而释放价值的阶跃变化。但是,尽管它可能证明对知识产权持有人有利,但它也对他们构成威胁,使每个人都更容易创建高质量的媒体。
艺术家、作家和其他创意人员需要适应。一些创意人员会看到巨大的效率提升;许多其他人将变得过时。随着人工智能的进步,对人类艺术作品的需求可能会消失或大大减少。
共享的文化引用可能会消失。尽管社交媒体的注意力分散了,但仍然存在共享的文化接触点。一旦可以通过无限可定制的选项按需生成媒体,这会丢失吗?饮水机时刻可能很少见。
在琐碎的痛苦中,很少有比完成一本好书更痛苦的了。这是一种奇怪的心碎,既太大又太小。你正在失去一个充满个性、斗争和意义的世界——但一个完全是虚构的世界,对你的生活没有任何真正的意义。
故事的结局可以成就故事,也可以毁掉故事,这是任何作家或电影制作人都知道的事实。海明威为《永别了,武器》写了 47 个版本,以「用词正确」,而库布里克则对《闪灵》的结尾大惊小怪,直到最后一刻才下令销毁剩余的镜头,以免闯入者重新安排他的构图。
请允许我用我最好的电视广告声音问:如果有另一种方式呢?如果您知道和喜爱的故事根本不必结束怎么办?如果你可以永远读你最喜欢的书或看你最喜欢的电影怎么办?
像大多数电视广告一样,隐含的产品听起来太奇妙了,不像是真的——就好像博尔赫斯为比利·梅斯写的文案一样。对于人类历史的总和,这一直是真实的。这种情况可能不会持续太久。
生成式人工智能的快速成熟并没有「扰乱」媒体创作——就好像一只恼人的大黄蜂敲打着玻璃板一样——还没有打破它的缝合。使用 AI 算法可以即时且廉价地生成令人惊叹的图像和称职的写作。就像早熟的孩子一样,似乎不可避免地会改进现有模型并添加新技能,直到创作一部新的海明威小说或希区柯克电影并不比用 OpenAI 的最新作品 ChatGPT 生成图像或短篇小说更棘手。
这对内容制作意味着什么?它将如何改变我们消费它的方式?输谁赢?在一个媒体层出不穷的时代,叙事对我们意味着什么?
首先,让我们进行定义。当我们说「无尽的媒体」时,我们指的是什么?
从根本上说,我们谈论的是媒体制作和消费方式的转变。AI 将使其能够按需生成,而不是偶尔创建。如果你想让 JK 罗琳或乔治 RR 马丁再写一本书,你必须等他们去做。根据他们对写作的兴趣,这可能需要一段时间,比如几十年。
电视节目、专辑、游戏和所有其他形式的媒体也是如此。创意过程取决于人力资本,这需要时间。
相比之下,人工智能没有人类的局限性。它可以以更快的速度处理和生成信息。虽然它还不能制作一部有声望的 HBO 电视剧,但我们已经看到它能够比人类更快地撰写博客文章或召唤图像。一张 DALLE-2 图片可能需要一个人花费数周或数月才能完成,但模型会在几秒钟内生成。
一旦媒体可以即时生成,它将改变我们使用它的方式,因为我们的欲望将不再受内容可用性的限制。如果你想读另一本指环王书、村上春树的短篇小说,或者玩一款荒野大镖客风格的游戏,你不需要等待他们的创作者的努力(或复活)。您只需导航到一个或另一个平台并制作新作品。
您还将以无法预料的方式定制您的媒体,指定设置(输入:新朋克中土世界)、情节结构(输入:Bilbo、Saruman 和一个 Ent 的三角恋)、基调(输入:黑色喜剧),以及任何其他变量的数量。创作原创故事几乎毫不费力,而且——根据版权的执行方式——创作同人小说风格的混搭可能同样简单。
我相信这是一个无限媒体的世界。我们今天有多近?
为了推动这一运动的兴起,生成式人工智能必须在三个方面取得成功:
根据你的基准,有人可能会争辩说 AI 要么满足这些标准,要么距离很远。像 Midjourney 这样的产品可以在几秒钟内以几美分的价格轻松生成令人愉悦的图像。当我要求它创建一个特纳式的外星海景时,护卫舰在日落时战斗,它做了这样的输出:
非常好!奇怪的是,我为此感到自豪,好像我的提示展示了品味或智慧。看看我们对合成作品的依恋程度或疏远程度将会很有趣。
OpenAI 的 ChatGPT 功能——它使用了一种被称为「GPT-3.5」的新的、先进的模型——更清楚地表明了作家 AI 的强大之处。我要求 ChatGPT 以 Cormac McCarthy、Haruki Murakami、Shirley Jackson 和 Chinua Achebe 等作家的风格创作几篇短篇小说。ChatGPT 似乎还不理解样式。它主要围绕作者最喜欢的词、主题和设置,而不是真正模仿句子结构。纳博科夫的模仿以一位美丽的女人为特色,但没有尝试他恶作剧的文字游戏;麦卡锡给人的印象是荒地背景和无赖的主角,但不敢尝试与他的奔跑,奔腾的散文相提并论。
尽管如此,结果还是好得吓人。有说服力的,有趣的,并且让人联想到所讨论的作家。故事在几秒钟内到达,并且完全免费。诗歌实验表明 GPT-3.5 也理解押韵方案和韵律。
如果您的媒体饮食完全由精美的绘画和扎实的短篇小说组成,那么您已经可以有效地享受无穷无尽的媒体。更复杂的产品仍然遥不可及。我们似乎还没有制作出一部可以取代《继任者》的连续剧或安妮卡森本可以写的散文诗。
本文的其余部分是纯粹的思想实验还是实际讨论取决于您如何回答这个问题:我们会到达那里吗?从 AI 生成的博客文章和漂亮的图片到司汤达、斯科塞斯和斯威夫特(两者)的复制品,是否存在技术上可穿越的路径?如果没有,那么我们可以保留我们的人类天才理论——人工智能将处理烦人的和衍生的东西,把伟大的艺术和伟大的媒体留给人类的思想。如果是这样,那么我们剩下的担忧就是时机问题。它迟早会到达?下一个十年还是下个月?(或者,可怕的是,明天?)
甚至在年底之前,我们就可能会看到相当大的进展。如果谣言可信,OpenAI 的 GPT-4 预计将在 2022 年 12 月至 2023 年 2 月之间推出。虽然细节很少,但它被认为是一个重大飞跃。反对生成式人工智能的快速进步越来越让人觉得站不住脚。
在一个媒体层出不穷的世界里,价值从何而来?我们应该期待什么样的转变?
在考虑无尽的媒体时,我传统上期望有价值的 IP 持有者从中受益。如果您拥有哈利波特特许经营权,那么能够以低廉的价格按需生成无限媒体的能力将是一个巨大的福音。你会把生产成本削减到接近于零;更好的是,您将能够更好地从客户身上获利,增加频率、可靠性,并且可能还有 LTV。与其每两年花 20 美元买一张电影票或一本书,粉丝们可能每月支付 20 美元来访问一项服务,该服务可以分享 Potterverse 的新内容或允许客户自己生成内容。
顾客不会觉得无聊吗?有些可能。但同人小说和同人论坛的流行表明,消费者正在寻找在传统发行之外发挥对特许经营权的痴迷的方法。好莱坞最可靠的表演者往往是翻拍或续集。2017 年的一项研究发现,有史以来票房收入最高的 50 部电影中有 41 部建立在现有 IP 之上;重启或续集的绝对数量从 1981 年的 16% 上升到 2019 年的 80%。迪士尼特别适应这些动态并善于利用它们。通过其 Disney+ 订阅服务,它已将 Star Wars 和 Marvel catalogue 等票房大片扩展为流媒体系列。
IP 持有者获利的程度可能取决于允许他们保护资产的积极程度。随着更多的钱可以从粉丝身上获利,特许经营权变得越来越好诉,关闭未经授权的游戏、商品和体验。虽然保护知识产权持有人有好处——尤其是在谈论在世艺术家或作家时——但过度监管可能会限制进一步的创造力。
大型语言模型背后的公司对 IP 使用采取不同的立场,这说明了对源材料的访问如何影响您可以制作的内容。
一周前,当我在 OpenAI 中输入「Harry Potter」这样的词时,出现了一条消息,指出该搜索违反了公司的内容政策。当我今天再次尝试时,我没有遇到这样的摩擦,愉快地生成了一系列 IP 热门歌曲:哈利波特演奏神奇的萨克斯管,米老鼠击掌皮卡丘,以及新朋克卢克天行者用他的光剑烤棉花糖。
尽管 DALLE-2 允许这些提示,但它很难生成高质量的图像。尝试生成像 Hello Kitty 和 Pacman 这样的角色会导致无法识别的结果。将它们与 Midjourney 进行比较,您会发现明显的不同。类似的提示产生了更好质量的图像:
造成这种差异的原因是什么?可能是模型在训练期间暴露于相关图像的程度。为了避免版权问题,OpenAI 似乎已经确保它对 Hello Kitty 或 Luke Skywalker 的外观有所了解。Midjourney 和 Stable Diffusion 似乎没有那么多疑虑。
许多最有趣的无尽媒体将依赖于全新的 IP。与其输入类似「为我制作一部新的星球大战电影」这样的提示,我们可以说,为我制作一部原创太空奇幻电影。愉快的事故将伴随着机器智能催生出让我们惊喜和兴奋的故事,打造全新的粉丝圈。特别是如果访问受到严格保护的 IP 受到限制,这些作品中的许多可能质量更好。(另一篇文章的主题:如果我们不小心,AI 模型的制造者可能会将什么样的叙述偷偷带入新媒体?)
谁将拥有这些原创内容?建立模型的公司?帮助您创建它的平台?还是你,提示者?这也将是一个有争议的问题。例如,DALLE-2 允许用户出售图像,但一些律师认为这些条款自相矛盾。
无论所有权如何,我们都应该期待大量的内容让当前的卷看起来古怪。至少在某些方面,这对用户来说可能是一个有意义的胜利,能够第一次在他们想要的时候生成他们想要消费的东西。想找一部以 18 世纪日本为背景、奥尔罕·帕慕克 (Orhan Pamuk) 风格的悬疑小说,在炉火旁欣赏吗?或者在不久的将来观看一部黑色喜剧英国侦探剧怎么样?所有的情绪、心血来潮和嗜好都可以在它们生起时得到满足。
如果考虑要生成的内容感觉工作量太大,您还可以深入研究其他用户生成的越来越多的无限内容。新平台将帮助我们对这些无穷无尽的杰作和负罪感进行排序,而工具会将我们的兴趣映射到这个庞大的纲要中。有助于发现、管理和推荐的产品将积累价值,因为丰富使这三者变得更加重要。
我最近一直在思考的事情:技术使听起来合理的类比变得毫无意义。行业的规模和速度超过了我们简化和翻译的能力。当我们试图通过信箱填充宇宙时,太多的细微差别丢失了。
考虑到这一点,当涉及到专业艺术家时,我们应该谈谈生成人工智能的巨大不公平。业界最强大的模型已经在人类生成的数十亿个数据点上进行了训练。数以百万计的绘画、卡通、照片、散文和书籍被摄取和吸收,为模特提供食物。人类辛辛苦苦开发出来的独特而奇怪的技能突然被整个吞没,变成了任何人都可以使用的商品。现在,有了互联网,就可以像梵高一样作画或像迪斯尼那样制作动画。
这公平吗?在某些方面,这感觉像是一个没有结果的问题。它正在发生,并将继续发生。公平与它有什么关系?海啸没有良心。当技术在这样的时刻加速发展时,最好的办法是确保尽可能负责任地开发和指导它——引导其力量远离脆弱区域。
答案当然是:这不公平。这就是类比显示其局限性的时候。与之相对的是,人工智能的发展与人类相似。它与其说是模仿现有的艺术作品——复制粘贴像素或改组文本以适应新环境——不如说是学习。它学习和提高,就像我们一样!
除此之外,我们无法摄取 50 亿张图像。我们不能只看少数几件仿制品就神奇地模仿它们的风格。我们需要超过五秒钟才能画出教皇坐在自行车上吃苹果的肖像。将 AI 的能力与人类学习能力进行比较会抹杀它的惊奇并淡化它的风险。银河系深不可测的跨度或海滩上包含的无限沙粒——这些都是更明智的比喻。
艺术家会适应吗?有些人会受到这项技术的鼓舞,用它来改进他们的工作并节省时间。一个乐观的框架是艺术作品将被「半人马化」。人类和机器将结合起来创造出比任何一方单独管理都更伟大的东西。有一段时间,「半人马」是表现最好的国际象棋选手,无论是单独的人类还是独立的算法。但随着人工智能的改进,人类干预变得越来越多余或适得其反。不过,从中期来看,「半人马」可能会蓬勃发展,创作出令人印象深刻的绘画、电影和书籍。
根据 AI 带来的变化速度,许多艺术家可能会成功地转变为相邻的角色:作家成为编辑,画家成为艺术设计师。那些在「世界建设」方面有天赋的人——创造人工智能发挥作用的范围——也可能暂时繁荣起来。不过,人工智能似乎并没有失去胃口。它也可能会吸收这些任务。
在很多方面,我希望我对人工智能对艺术家的影响是错误的。(我经常这样,我提醒自己。)虽然我对 AI 释放新形式的创造力感到兴奋,但我仍然是……一名作家。手指、拇指、肌肉和灰质的混合物,需要食物才能运作,也需要金钱来购买食物。一个文字是机器制造的世界将在经济上不利并且在利己主义方面是灾难性的。(我不是作家,我是什么?请不要让我走马车点灯的路。)
一种可能性是,随着富足变得过剩,我们更加重视人类的工作。正如机器时代存在手工艺品市场一样,尽管人工智能具有效率和经济性,但仍可能存在对人造艺术、音乐、文学和电影的需求。
除了艺术家的转变生成人工智能先驱之外,其创造性产出的速度和数量可能对社会产生更广泛的影响。在「权力下放的国家」中,我认为互联网和社交媒体已经迎来了一个「分形真理」的时代:
互联网降低出版成本和取消看门人使得「出版商」的数量猛增。当然,出版商的定义已经发生了根本性的变化,从指代组织转变为指代个人。现在,每个发推文或发帖的人都充当主权发布者,为其他互联网公民的信息饮食做出贡献。
在这种扩张的重压下,真理变得分形。不久前,个人仅从几个新闻来源收到报道。虽然意见可能存在一些差异,但总的来说,对特定主题的观点数量是有限的。今天,每个话题都经过数以千计甚至数以百万计的竞争意见的折射。
在广阔、不确定的互联网空间腹地,区分这些需要时间和持续的认知能量。由于公民报告的发展暴露了传统出版商的盲点和偏见,消费者不能再简单地默认相信一个来源,而必须在成百上千之间摇摆不定。由于没有仲裁者,用户会遇到更多样和奇异的位置,而现有平台偏爱极端位置。其结果是分形真理的创造,其中每个人都只看到总体模式的一小部分,但仍然相信他们立场的权威。在线分享的每个新观点都可以分叉,从而进一步分形。
无休止的媒体将产生类似的影响,创造出越来越分形的文化。尽管互联网已经允许子群体和利基社区繁荣发展,但仍有一些文化现象相互交叉。例如,如果你是 1990 年代生活在贫困线以上的识字儿童,那么你与哈利波特有某种关系实际上是不可避免的。也许你喜欢它,也许你讨厌它,也许你刻意漠不关心——但你知道它。你可以与那个领域的其他人产生共鸣。每个超级畅销书、票房大卖、白金专辑和冷水电视节目都存在这种变化。尽管它是如此根深蒂固,但我们可能很少意识到它;我们有一套全面的共享参考资料。
这会在无尽的媒体中幸存下来吗?如果我们的消费在定制生成的内容中被分割开来,哪些叙述会成为我们文化的一部分?我们会失去什么共同语言?
「从什么时候开始和结束的任何一首诗的第一行和最后一行?」谢默斯希尼写道。
人工智能将创造我们一生中的许多奇迹。如果我们的发展方向明确,从医疗保健到教育再到重工业,每个领域都可能会重塑自身的一部分。巨大的飞跃似乎是可能的。
与其他行业一样,媒体也将面目全非,改变我们与艺术、信息和意义的关系。这首诗没有结束的迹象;让电影放映;并随着音乐不断播放而聆听。