
11 月 30 日,由中国人工智能学会主办,CAAI 智能传媒专委会、新浪新闻联合支持的“人机协同与传播新范式”专题活动在北京落幕。在活动中,艾瑞数智首席战略官汪俊发表演讲并发布了《中国 AI+ 互联网媒体行业研究报告》。
以下是演讲实录,内容经编辑略有删减:
AI 这些年已经成为非常重要的关键词。今年 7 月 23 日在华盛顿的 AI 峰会上,美国发布了《AI 行动报告》,这个行动报告在三个方面要推动 AI 成为美国在全球竞争力的重要组成部分:第一是加速 AI 的创新,第二是建设 AI 基础设施,第三是推动 AI 技术的外交。
中国在接下来一个月,在 8 月 27 日的时候发布了《人工智能 + 行动指导意见》,这里面都是人工智能相关的行动指导意见,但是中美呈现出不同的特点。美国更在意的是将人工智能打造成国家竞争力,中国更在意的是加强 AI 在各个领域里面的应用和渗透,所以我觉得重点是有差别的。
媒体行业是受技术影响非常快的行业,所以我们今天发布这样一个报告来看一看整个人工智能在未来怎么样进一步改变媒体行业。
行业研究我想跟各位讲一下媒体行业发展路径和 AI 发展脉络进行梳理,这样便于我们看清楚历史、现在和未来是怎么产生影响的,这是我今天主要分享的内容。
第一部分先看一下互联网媒体和人工智能这两个东西分别发展的路径和脉络是怎么样的。
先看一下互联网媒体发展的历程,我们把中国互联网媒体划分为五个阶段,大概经历了 30 年左右的发展历程。前面三个阶段大家都已经经历过。
第一阶段出现门户网站,这时候内容集中制作,并且通过平台来发布,这个阶段出现了新浪、搜狐、网易这些企业在 2000 年成功上市。
后来专业的内容生成被用户生成内容替代,这里产生了很多媒体和社交之间融合的场景,这是我们在第二个阶段看到的关键点。
第三个阶段我们从桌面向移动在迁移,出现了移动互联网对应的移动媒体,在这个阶段我们主要还是随着通信技术的发展和 IT 技术的发展,把我们的媒体平台向移动端来迁移,这是非常重要的一个点,因为向移动端迁移以后它的渗透率和普遍性就会大幅地提升。
第四个阶段我们看到一些 AI 算法可以加入到内容分发上面去,几乎所有的媒体都在利用 AI 算法对人做定性的推动,大家看到类似于新浪、抖音这些平台都在通过内容分发的技术向特定人群推广他们可能喜欢的内容。
第五个阶段迈向了 AI 赋能智能生态融合的新时期,这里面有两个关键词,第一是 AI 赋能,有 AI 以后我们会发现媒体在每个环节都会变得跟过去不一样,第二是智能生态融合,现在整个媒体已经包括了多种模态和多种生态的融合状态,这会使互联网媒体进入新的时期,大的发展历程是这样子的。
当前的情况下面临什么样的困难和问题呢?整体来讲,互联网用户的规模已经见顶了,无论是用户数、渗透率还是使用时长已经到达了比较高的水平。互联网的普及率到 2025 年上半年,数据已经接近 80%,这里面还有小孩、老人没法用移动互联网,所以已经进入饱和的状态了,终端数也超过 14 亿。一个人平均一周使用互联网上网的时长也超过了 30 个小时,这个增加了空间,所以这个情况下,互联网竞争进入存量精耕细作的阶段。
结合第一页和第二页的内容大家可以看得到,这个时间可以利用 AI 更好地发展媒体行业是迫在眉睫的一件事情,这是媒体行业发展大的脉络。
另外一条路线我们看到人工智能是怎么发展的,我们也回忆一下人工智能发展的历史。从人工智能发展到现在,从 1950 年图灵实验提出来开始,到现在也不过是 70 多年的时间,而 70 多年的时间中间有差不多 60 年的时间是属于 AI 发展比较早期的阶段。
我们在第一阶段启蒙和萌芽阶段差不多经过了 40 年的时间,到 1990 年之前都是处于符号主义和逻辑推理的阶段,这个阶段整体来讲人工智能发展对我们的影响还是比较小的。
1990—2010 年这 20 年的时间,开始出现了统计学派,以统计的方法来做深度的,这里面出现机器和人之间做博弈,比如象棋、围棋的大战。这个时代结束是以辛顿在 2006 年提出深度训练网络和深度学习为阶段性的标志。这之后人工智能的技术进入到了新的时间点,大家知道辛顿 2018 年获得图灵奖,去年获得了诺贝尔物理学奖,这对于人工智能的发展有非常重要贡献的一位科学家。
2010—2017 年有些深度突破,在统计基础上 AlphaGo 击败了李世石。2017 年 Google 提出了 Transformer 架构为终点,进入 2017 年以后就进入了技术快速的迭代时期,GPT 等等模型就发布出来了,Transformer 的架构也取得了真正的突破,并且人工智能的技术和其他的 MOE 等技术开始进入了融合和涌现的阶段。
人工智能爆发阶段还是 2023—2024 年的时间,这才是量变到质变的过程,很多公司发布了自己的大模型,我们发现大模型的能力越来越强,尤其是在语言模型这一侧基本成熟了,架构也类似了,和 MOE、RAG 等技术已经进入深层次融合,这是爆发的阶段。
2024 年以后进入深化新的阶段,特别是最近不断有新的技术和新的产品出来,比如 GPT3 出来以后大家觉得它太强。我那天做了一个实验,女孩跟男朋友讲“你到早了等着”,“你到晚了等着”,这两个“等着”的意思是不一样的,第一个翻译成等待,第二个翻译成有好果子吃或者小心一点,它能够区分出语境中两个“等着”的不同含义,这个阶段已经进入了比较高级的阶段。
语言模型已经进化的比较好了,多模态还有进步的空间,我们相信今后一定会有快的突破。这是大语言模型在今年取得的重要突破,虽然个别与个别有优势,但有这么几个大的特点。
第一是过去追求模型大,到现在开始转向构建更加专业的矩阵,有更好的语料来训练它,在垂直领域里做更好的思考,这样每个人就可以具有行业应用的特点。
第二是在能力方面大家不断地增强,尤其是现在大模型发展智能体已经成为大模型很重要能力的表征,你能不能很快地支持大家在你的模型上构建智能体,这点对每个模型都变得非常非常重要。
第三是实现全模态化,多种模态我们都可以做,现在大模型不仅能够生成语言,还能够生成 PPT、生成视频、生成图片等等,多种都可以生成,这种就带动了大语言模型价值向更加场景化的应用来发展。
我们最近也帮一些企业在做数字化转型,现在叫智能化转型,很多企业成功提供智能化转型提高了效率并且制造了新的收入来源,这是发展非常快的,这是大语言模型发展大的路径。
在这个情况之下,不同模态技术成熟度有差别,相应它的渗透率也是有差别的。文本、图像和音频这几方面的生成已经比较成熟了,尤其是在文本生成方面它的准确性、逻辑连贯性、成熟领域适配性都达到了比较高的水平。图像的生成现在能够生产比较高精确度的一些图像,通过 DAT 技术可以实现高精度的技术,但总体来说还是有些短板,它的技术迭代也非常迅速,现在慢慢进入了使用状态。现在做海报不用自己画了,基本通过 AI 都可以生成了;音频可以产生接近人类的声音;视频 3D 生成和综合解决方案还是属于探索的阶段,我们也期待这些方面的技术能够快速地进步带动应用场景的发展,有些公司在这方面作出非常好的实例和有用的例子进入到真实的应用场景了,我们相信渗透率较低、技术上还有 gap 就是我们前进和未来发展的空间。
我们看到人工智能的技术很多领域也在爆发式增长,结合这两条路线,下面看看 AI 技术对互联网媒体是怎么样深度赋能的。
大的路径上来讲,技术影响下新兴媒体跃升还是非常快的。刚才讲专业内容生成到用户内容生成两个阶段发展技术的切入因素是什么?我们用更好的工具和方法压缩图片,支持快速生成我们的图片,这就导致我们 UGC 就大幅地扩大。到后来视频快速地崛起原因在哪里?因为我们有 4G、5G 新的网络技术来支持我们去做这件事情。同时,内容分发很多技术避免所有人都看一个屏幕不同人可以看不同东西,这都使内容形态发生根本的变化,所以 AI 也是这样新的技术。
AI 技术之下我们就会进入全民创作、人机共创的时代,有的时候图片出来到底是人做的还是机器做的,我们不一定能够作出非常清晰的区分,这就进入人机共创新的时代。
具体来讲,AI 互联网媒体的赋能我们从四个方面来看都有很重要的赋能。
第一在内容生产方面,早期是 PGC 专家生成的,必须专业的人员才能生成内容;后面是 UGC 就是用户生成;现在是 AIGC,就是 AI 来辅助我们生成内容。这个阶段对普通用户来讲,他们可以更方便地生成我们的内容。现在大概有 11 个亿的互联网用户,其中有 5 个多亿已经是 AI 用户了,AI 用户比重差不多占所有用户比重 50% 左右的量级,很多老年人都会用豆包生成一些东西,他用的已经很习惯了,所以对于普通人来说生成利用的门槛大幅降低了。
对于专业的媒体工作者来讲也可以提高效率增强我们交互的体验,并且更加深度做媒体内容的融合,所以在很多专业媒体方面大量采用了 AI 内容生成的技术。这里当然也放了一些案例,比如我们在多模态的融合创新方面官媒已经做好多的事情了,深度信息融合方面,比如说人民日报、百度、新浪都有自己的内容生成的工具,来帮助大模型快速生成内容。内容生产这一侧产业的价值开始跃迁了,内容开始变得更加丰富,内容创作的门槛、品质都有很大程度的提高,这是我们看到第一方面的影响。
第二方面在内容审核方面,我们也会做很多的赋能。生成式 AI 在赋能内容审核方面,从审核的自动化、审核的精准化、人机互补、协同、策略动态化方面都作出很多新的贡献,改变了内容审核的流程。传统上我们是人工初审再复审的方式,人在那儿看,眼睛都看瞎了,现在基本上变成了 AI 做初审再做风险的分级,最后人再做一下复核就可以了,大大降低了人工作劳动强度,没有必要劳动强度的降低,内容审核方面也有很多 AI 的应用。
第三方面是在内容分发和平台运营方面,现在任何一家媒体平台公司都有基于 AI 的内容分发和传播的功能,它可以更好地去洞察用户的行为、特征以及偏好,基于这个偏好来适配相应的内容给到用户,这是它非常重要的做法。同时,我们在用户的运营与用户的服务方面都采用了 AI 作为一种工具和手段提高精准性,基于这样的东西也产生很多平台管理和商业模式方面的创新,只要我们能够满足信息、消费的个性化需求,并且把他的体验提高那黏性就会增强,黏性增强那商业价值就会提高。
我们最近发现,利用 AI 来做 GEO 的营销模式已经开始出现了,这就是说内容分发侧可以产生定向推动的价值。现在互联网有可能取代现在大型的平台的流量大权成为新的流量入口,这个可能性是很大的。大家想想,今后去一个地方旅游,我们通过智能体就可以定行程,这时候我不在意订的机票是携程还是美团,我都可以以最低的价钱或者最方便的方式进行预定,这个影响是非常大的,会对平台平权产生非常大的影响。这是内容分发和平台运营方面,既有 AI 在里面起作用,同时又会产生新的模式和机会。
在内容消费这一侧,过去每个人就是内容的消费者,你看东西就好了,慢慢我们也会成为创造者,我们叫产消者,既生产又消费,我们还可以创作。这里面有好多新的技术,比如我们帮助特定的人群能够使内容触达的门槛降低,比如有些老年人他不懂英文,但没有关系我们可以 AI 实时翻译成中文,这些东西都使得内容触达的范围更广。还有一些用户要看 10 分钟、15 分钟的东西觉得太长了,那怎么办?AI 可以帮他做摘要,他看简单的要点,他看完要点觉得有意思精读就可以了。我们也可以利用 UGC 的平台产生一些新的内容,我们现在看很多视频的网站都会发现下面有一个“这个内容是由 AI 生成的”标签,如果不打这个标签我相信很多人不能够区分是真实拍摄的还是通过 AI 生成的。内容消费这一侧通过 AI 产生很多新的机会,四个方面都产生了重要的影响。
下面我们看一下 AI+ 互联网媒体大生态里面的典型案例。这是我们画的生成式 AI 技术 + 互联网产业图谱,这个图谱分三层,AI 基础层,包括 AI 基础设施、算法和算法的基础设施,有一些 AI 的关键技术;中间一层有大模型层,大模型分两大类,第一是通用的大模型,我们叫基模,还有一类叫做媒体的自研大模型或者是垂直类的大模型,这里面包括央视听、新华社、知微等等,都是属于垂类的大模型;再上面是日常接受到能够看到不同类型媒体平台,比如说社交媒体像微博、微信这些,比如知识媒体像知乎、知识星球,还有新闻媒体,比如一些央媒包括地方媒体、互联网的传统媒体,第三是文体生活类的媒体,像抖音、快手、小红书,还有电商媒体还有其他类的媒体,这个媒体都是架构在大模型和大模型底层技术之上的,这里面不同的公司在里面找自己的定位和布局,有些甚至实现了上中下三层的垂直一体化,这是大的趋势。
我们看到官媒们都在做这方面的探索,比如人民日报自有 app、短视频平台、社交媒体平台、自有网站等,可以做生成式 AI 技术的编辑部、智能化内容生产的平台,这些平台使得它在内容生产和传播方面比过去更快、更智能、更高效一些,这就是人民日报它的典型的例子。
大众社交媒体在 AI 方面也加强了这方面的探索,比如微博用户规模和活跃度还是非常高的,用户日均使用时长差不多 36 分钟,持续通过 AI 来赋能内容生产者,到 2025 年 9 月份我们看到微博的金 V 创作者达到了 12.5 万,这里面知 V 大模型就有智谱、博主 AI 助手、评论罗伯特的功能,都可以加强我们跟用户之间的互动,通过多模态的理解、垂直领域的优化和深度的智能能力,来加强自己 AI 产品的矩阵,这也是 AI 方面有非常深度的应用,我们看到典型例子是这样子的。
进一步理解在技术架构和功能特点方面,技术架构方面艾瑞和大模型做了深度融合,同时也在出具树立方面有自己独特的优势。功能方面我们可以对一个事件做脉络的重构,整个事件从开始到后面是怎么样一个过程都可以描述出来,经过刚才描述的,互联网媒体发展的轨迹和人工智能发展的轨迹一样,把一个事从头到尾捋清楚方便你更好理解全景。另外做多维信息的整合,另外做可信的搜索服务,因为现在网络上真假消息不一定准,我们利用可信的信息搜索服务是非常重要的内容,免得谣言到处飞,哪个地方是真的还是假的我们在上面搜索一下就了解情况了。
不管是官媒还是平台式的媒体都在大量使用 AI 来赋能用户、赋能生产者,能够更好地传播和传递内容,这是我们看到 AI 在媒体领域典型的应用。
最后,AI 时代互联网媒体行业不是一帆风顺的,这里有很多挑战和问题,我们也有一些应对的策略。这块我简单讲我们认为四个方面的挑战,我们也希望全行业一起解决好这些挑战,使得 AI 更好地赋能媒体行业的发展。
最大的问题是信息的真实性问题,因为 AI 生成本身就有幻觉,AI 你喂语料有些地方有瑕疵,它生成的内容一样有瑕疵,信息真实性的风险是在加剧的,有些虚假的新闻、版权和误导的舞蹈甚至溯源和鉴别的问题,这都非常非常难区分。用户看一些视频的东西有时候大家要小心一点,有时候质量不一定高,你看到的东西不一定是真实的事件,因为这里面内容真实性有很多问题。从侧面上讲,以 AI 来治 AI,平台多模态来审核整个内容,就像现在学生一样,学生也可以用 AI,老师们也会用 AI,把你写东西让 AI 评判一下,是你们自己做的还是 AI 做的,这涉及 AI 和 AI 对抗的问题,我们拿到的信息给另外一个大模型评判一下好还是不好。还有就是平台做好内容引导的机制,中国的平台不是纯平台,他对内容要有引导、过滤、标识的机制,有这样的机制才能避免虚假信息的传播和泛滥,也就是信息真实性的挑战。
第二是视觉效果的挑战,AI 确实能够生成一些图片和视频,但效果不好,我们有时候看到一个人你会发现有六根手指出,你看视频很明显有一些不真实的地方,连贯性、角色一致性都有很大的偏差,在应用和应用层面有一些策略会改善视觉的效果,提升质量。
第三是技术成本方面的内容,特别是多媒体多模态的 AI 中间,对算力的消耗、对数据的需求都还是非常高的。艾瑞我们 20 多年有 4000 份报告,很多大模型公司拿我们的报告作为基础语料去训练他们的模型,我想这个对我们来讲也是一种责任,我们一定要把数据和内容喂得更准确一些,这也是一个要求。技术层面也还需要我们去通过自有垂类模型形成一些竞争的壁垒,这对媒体也是非常关键的,刚才我们看到有些媒体做了自己的垂类模型,为什么要做这件事情?我们自己有垂类模型加上我有自由的内容,相对其他媒体来讲能够形成一个比较有效的壁垒,这个对于我们在行业里面确定地位是非常非常重要的,这是第三方面的挑战。
最后一个方面是安全隐私方面的挑战,我想在座各位都有这样的担心,担心我们的数据被过度地使用,担心算法具有自己的偏见,你讲的观点和他的观点跟他不一样,担心工具被恶意使用,在这里不光是技术的手段,未来它还需要有很多技术层面的策略以及管控方面的策略一起做成。所以我们叫法、数、器都要有,既要有立法来限制这件事情,既要有工作流限制这个事,还要有具体的工作和手段达到监管的目的和目标,这四个方面还是面临很大的挑战。
相信随着技术的进步,AI 的发展一定会对互联网媒体产生一波新的发展机会。这是我跟大家分享的内容配资平台费用低,谢谢大家!
文章为作者独立观点,不代表正规配资门户网_配资平台门户导航_配资指数网观点