AI × 加密:去中心化愿景的现实考验
🍕 Happy Bitcoin Pizza Day !
多元化的机遇与挑战:AI 与加密技术的交叉领域呈现出多样化的发展格局。从去中心化数据市场到分布式计算,从模型输出验证到区块链身份识别,每个细分赛道都面临独特的机遇与挑战,不宜一概而论。
技术可行性 ≠ 市场优势:基于加密的 AI 解决方案大多在技术上是可行的,但要获得真正的市场优势仍需克服诸多障碍。在面对中心化竞品的挑战时,“去中心化”本身并不足以成为决定性的竞争优势,这些项目还需要在性能、成本、易用性和监管合规等方面取得突破。
理性看待市场热度:AI 代币的强劲表现可能更多地反映了市场对 AI 行业整体的乐观预期,而非这些项目本身的内在价值。许多 AI 代币可能缺乏真正的需求驱动力,投资者应当谨慎评估其长期可持续性。
自 2022 年 11 月 30 日 OpenAI 正式发布 ChatGPT 以来,生成式人工智能的更新迭代日新月异,引起了公众和投资者对 AI 行业的高度关注,同时也为基于 AI 叙事的加密项目提供了发展机会。AI 赛道的项目融合人工智能和加密技术,推动了 DeComp、ZK、数据以及应用等方面的创新。但随着人工智能行业的不断发展完善,我们也应该正视 AI×Crypto 所面临的实际挑战。后文将对当前 AI 行业的发展趋势以及加密与 AI 的交集领域进行梳理,并分析其中存在的机遇与挑战。
AI 行业主要发展趋势
人工智能领域的发展变化速度是空前的。据 Demandsage 报告显示,ChatGPT 仅用短短两个月就吸引了一亿用户,相比之下,社交巨头 Twitter 花了五年时间才达到同等规模,而流媒体翘楚 Netflix 更是耗时十八年。除了增长速度外,AI 模型本身的技术进步也是飞跃式的,一年多前独领风骚的 GPT-3.5 如今性能早已被后来居上的各类大语言模型全面超越。基于扩散的生成式图像、音视频模型输出效果相较一年前也堪称天壤之别。
图1 ChatGPT 上线两个月就吸引了一亿用户 | 数据源:Demandsage
AI 行业的飞速发展,要求我们必须以更加审慎的视角重新审视加密平台在 AI 领域所扮演的角色。当前大多数 AI 代币,尤其是采用固定代币经济模型的项目,其长期的价值积累路径仍充满着不确定性。同时,加密技术在应用于新兴的 AI 领域时,还可能因暴露在更广阔的市场竞争和监管环境中而面临更大的挑战。当然,人工智能与加密技术的交叉领域广阔,仍蕴含着多样化的机遇。以下是与加密行业密切相关的 AI 行业主要发展趋势。
开源文化繁荣
在人工智能领域,开源模型文化的持续蓬勃发展无疑是与加密 AI 产品密切相关的一个关键趋势。目前,Hugging Face 平台上已有超过 70 万个模型供研究人员和用户自由操作和微调。用加密领域广泛应用的平台类比,Hugging Face 之于 AI,就相当于 GitHub 之于代码托管或 Discord 之于社区运营,其地位举足轻重。
Hugging Face 平台上的模型种类丰富多样,涵盖了从大型语言模型到生成式图像和视频模型等各个类型。其中不仅有来自 OpenAI、Meta、Google、阿里等行业巨头的模型,也包括众多个人开发者的创新成果。值得注意的是,如图 2 所示,某些开源语言模型在拥有可比输出质量的同时,处理速度和价格甚至超越了最先进的闭源模型,这也确保了开源模型与商业闭源模型之间能保持一定程度的竞争关系。
图2 大语言模型输出质量、输出速度、价格对比 | 数据源:Artificial Analysis
围绕 Hugging Face 形成的活跃开源生态,加上巨头间激烈的商业竞争,共同构建了一个开放、协作同时又充满挑战的环境,缺乏竞争力的模型会被迅速淘汰,从而促进整个行业的快速进步和优胜劣汰。开源文化正在推动整个 AI 行业通过良性迭代向更高效、更创新的方向加速发展。
小模型性能提升
小模型的质量和性价比显著提升也是重要趋势,早在 2020 年就已出现对小型模型的研究,最近微软的一篇论文也再次证实了这点。这种发展与开源文化相得益彰,为本地运行的高性能 AI 模型开辟了广阔前景。
令人瞩目的是,一些经过微调的开源模型在某些基准测试中甚至超越了领先的闭源模型。这也使去中心化 AI 的实现成为了可能:部分 AI 模型可在本地设备上运行,从而最大程度地实现去中心化。当然,目前科技巨头们仍会在云端训练运行规模更大的模型,两种方案之间的权衡能为 AI 的设计带来更多可能性。
此外,考虑到 AI 模型基准测试任务的日益复杂化(数据污染及测试范围变化),生成模型的输出质量最终可能还是需要由自由市场中的终端用户来进行评估。目前市面上已经出现了供终端用户对比模型输出的工具,以及提供类似服务的基准测试公司。各种开源大语言模型基准测试如 MMLU、HellaSwag、TriviaQA、BoolQ 等,通常涵盖不同的使用场景,包括常识推理、学术主题及多问题格式,AI 模型评估的复杂性由此也可见一斑。
AI 集成收益巨大
拥有强大用户粘性或解决特定业务问题的现有平台,能从 AI 技术的集成中获得显著的收益。以 GitHub Copilot 为例,它与代码编辑器的深度集成极大地增强了开发环境的功能性。这种整合不仅提高了开发效率,还进一步巩固了 GitHub 在开发者社区中的核心地位。同时,AI 接口正被广泛嵌入到各种日常工具中,如邮件客户端、办公软件、设计软件等,说明了 AI 在提升工作效率方面的巨大潜力。
图3 Github Copilot 有效提升了开发的效率和代码质量 | 数据源:Github Research
但要注意,多数场景下,AI 模型并没有催生新的平台,而是在增强现有平台的功能和价值。这种趋势表明,AI技术更多地是作为一种增强工具,而非颠覆性的平台创造者。一些旨在改善传统业务流程的AI模型,如 Meta 的 Lattice,往往依赖于专有数据和闭源系统。这类 AI 模型由于深度整合到核心产品中使用专有数据,很可能会继续保持闭源状态。
推理为重
在 AI 硬件和计算领域,计算资源的使用重心正在从训练向推理转移。AI 模型的初始开发阶段需要对模型进行“训练 (Training)”,即使用大量计算资源来处理海量数据集,通过不断调整模型参数令其从数据中学习模式和关系的过程,通常需要高性能硬件和大量时间。而目前,焦点已经逐步转向模型的“推理 (Inference)”,即使用训练好的模型训练好的模型应用于实际问题,生成预测或决策的过程。
硬件巨头们也证实了这一趋势:英伟达的执行副总裁兼首席财务官 Colette Kress 在 2024 年 2 月的财报电话会议上披露,其业务中约 40% 收益来自 AI 推理。微软 CEO Satya Nadella 也在一月的财报电话会议上表示,Azure AI 的使用“绝大多数”都集中在推理方面。随着这一趋势的延续,希望通过 AI 模型获利的实体可能会优先考虑安全可靠并达到生产就绪状态的平台。
硬件竞争加剧
硬件架构的竞争格局也日趋激烈。英伟达 2024 年 3 月发布的 B200 处理器相较于 H100 实现了 5 倍的性能提升,而 GB200 将 2 个 Blackwell GPU 和 1 个 Grace CPU 结合在一起,能够为 LLM 推理工作负载提供 30 倍性能,同时还可以大大提高效率。此外,谷歌的张量处理单元 (TPU) 和 Groq 的新型语言处理单元 (LPU) 也可能在未来几年中增加在该领域的市场份额,成为替代方案。这种硬件多元化的发展趋势可能会重塑 AI 行业的成本结构,能够快速进行调整、大规模采购硬件、满足相关基础设施要求、提供优秀开发者工具的云服务提供商将从中受益。
图4 NVIDIA Blackwell、H100 和 H200 不同并行和分块配置的峰值吞吐量 | 数据源:NVIDIA Developer
总而言之,人工智能领域正处于快速发展的阶段。自 ChatGPT 首次面市至今时间尚不足一年半,该领域的进步速度令人瞩目。虽然某些生成式 AI 模型的偏见问题引发了一些质疑,但市场也正在自然淘汰表现欠佳的模型,转而青睐更优秀的替代方案。随着新解决方案不断涌现,加之即将到来的监管措施,该领域的问题空间可能会频繁变化。
对于这样一个创新迅猛的领域,我们更应该谨慎对待将“去中心化”作为万能解决方案的宣传,这种在加密行业很常见的叙事难免过于草率,其试图解决的可能是一个并不存在的“中心化”问题。实际上,人工智能行业藉由众多公司和开源项目在技术和业务垂直领域的竞争,已经实现了相当程度的去中心化。
此外,去中心化协议在技术和社会层面上的决策和共识过程,本质上决定了其发展要比中心化系统更为缓慢。在当前的 AI 发展阶段中,试图平衡去中心化和功能竞争力的产品可能会因此受到阻碍。但长远来看,加密技术与 AI 之间潜在的协同效应仍可能产生重要影响。
潜在机遇
我们可以将人工智能与加密技术的交汇点大致分为两个主要类别:加密+AI、AI+加密。
加密+AI,即利用 AI 技术对加密行业的优化和改进。这包括了一系列应用,从使交易更易于理解、提升区块链数据分析能力,到在免许可的协议中利用模型输出。这类应用的商业价值相对明确,尽管链上推理模型等复杂场景在技术实现上仍面临诸多挑战,但其长期前景依然广阔。中心化 AI 模型能够像改善其他技术密集型行业一样,优化加密领域的各个方面,包括改进开发工具、加强代码审计,以及将自然语言转化为链上操作等。
AI+加密,即利用加密技术通过去中心化方法(如去中心化计算、验证和身份管理等)来颠覆传统 AI 流程。对于这类的价值主张,应该用更为谨慎的态度对待,因为其面临的挑战不仅仅局限于技术层面(长期来看技术问题通常可克服),更涉及到与更广阔的市场和监管力量的复杂博弈。然而近期加密行业对 AI 叙事的关注大多集中在这一类别上,究其原因,主要还是此类用例更适合发行代币。
鉴于目前行业内“加密+AI”相关的代币相对稀少,接下来的讨论将主要关注第二类应用。这不仅反映了当前市场的关注点,也为我们提供了一个机会来深入探讨去中心化 AI 在面对现实挑战时的潜力和局限。
AI+加密
在探讨加密技术如何影响人工智能行业流程时,本文将其潜在作用范围大致划分为四个主要阶段:
- 数据的收集、存储和工程化
- 模型的训练和推理
- 模型输出的验证
- 模型输出的追踪
这四个阶段涵盖了 AI 从原始数据到最终应用的整个生命周期。近期,有大量新兴的加密 AI 项目在这些领域出现,试图将区块链技术的优势与 AI 流程的各个环节相结合。然而,在中短期内,这些项目很可能将面临两大主要挑战。首先是需求端的问题,即如何在一个仍在快速演变的市场中找到并满足真实的用户需求。其次是来自现有中心化公司和开源解决方案的激烈竞争,这些参与者已经在 AI 领域的技术实力、市场份额及用户基础方面建立起了相当的优势。在接下来的讨论中,我们将深入探讨每个阶段的具体挑战和机遇,权衡加密 AI 项目的创新潜力与现实困境。
数据获取与存储
数据是人工智能模型的根基,也是专业AI模型性能差异的关键所在。区块链技术的兴起为AI模型提供了一个全新且丰富的数据源。同时,一些创新项目,如 Grass,正尝试利用加密货币的激励机制,从开放互联网上整理新的数据集。就此角度而言,加密货币不仅能提供行业特定的数据集,还有机会激励新数据集的创建。Reddit 与谷歌达成的每年 6000 万美元的数据授权协议,就是数据集货币化潜力的一个鲜明例证。
图5 作为 AI 数据层的 Grass | 图源:Grass
早期的许多模型,如 GPT-3,混合使用了多个开放数据集,包括 CommonCrawl、WebText2、书籍和维基百科等,这类数据集可以在 Hugging Face 上免费获取。但近期的封闭源模型倾向于保护其训练数据集的具体组成,以维护商业利益。这种专有数据集的趋势很可能持续下去,逐步凸显出数据授权的重要性。
现有的中心化数据市场正在努力弥合数据提供者和消费者之间的鸿沟。在此背景下,新兴的去中心化数据市场解决方案面临着被开源数据目录和企业竞争对手夹击的局面,同时还要解决数据接口标准化、数据完整性验证和产品冷启动等一系列问题,并在市场参与者之间平衡代币激励。这些挑战在没有法律结构支持的情况下更显艰巨。
去中心化存储解决方案在 AI 行业的应用前景也值得关注。然而,现实中的障碍不容忽视:一方面,开源数据集的分发渠道已相当成熟;另一方面,专有数据集所有者对安全和合规有严格要求,而当前的监管环境尚不允许在 Filecoin 和 Arweave 等去中心化平台上托管敏感数据。实际上,许多企业仍处在从本地服务器向中心化云存储提供商过渡的阶段。在技术层面,这些项目的去中心化特性目前也与敏感数据存储的物理隔离要求不相符。
尽管有如图 6 所示的研究表明去中心化存储相比云存储在单位成本上更具优势,但对其竞争力的评估需要从更宏观的角度展开:在不同提供商之间迁移系统的前期成本、工具和集成能力的成熟度、业务运营成本的可预测性、合同保障、支持团队以及技术人才储备等因素都不容忽视。值得注意的是,除了亚马逊、谷歌、微软这三大云提供商外,市场上还有众多低成本云服务公司,这些公司可能才是价格敏感用户的首选。
图6 去中心化存储与云存储成本对比 | 数据源:CoinGecko
话虽如此,但 Filecoin 的 Compute-over-data 及 Arweave 的 AO 计算环境等去中心化存储领域的技术创新仍有特定的应用场景,如使用非敏感数据集或极度注重成本效益的新兴项目。
综上所述,加密技术在 AI 数据领域确实有一定的发展空间,但要产生颠覆性突破仍需找到能够创造独特价值的细分市场。在与传统及开源解决方案直接竞争的领域,去中心化产品可能需要更长的时间才能取得实质性突破。
模型训练与推理
加密领域的去中心化计算 (DeComp) 正崛起为中心化云计算的潜在替代方案。为应对当前 GPU 供应紧缺的挑战,Akash 和 Render 等项目提出利用分布式网络中闲置的计算资源,以低于传统云服务商的价格提供服务。
初步数据显示,这类项目正获得用户和供应商的青睐。以 Akash 为例,今年四月底其活跃租约数量较年初增长八倍,主要得益于存储和计算资源使用量的提升。
图7 Akash 网络租借数年初快速增长后出现大幅下跌 | 数据源:AkashStats
然而,网络收费在 2023 年 12 月、2024 年 5 月均出现下降趋势,跌幅超 60%,一方面是受币价波动影响,另一方面则是因为 GPU 供应增速超过了需求增长。对于定价随供需变化而调整的网络来说,如果供给增长持续超过需求增长,长期维持对原生代币的需求可能面临挑战。因此,这些项目的代币经济模型可能需要重新评估调整,以更好地适应市场变化。
图8 Akash 网络收费出现超 60% 的跌幅 | 数据源:AkashStats
技术层面上,去中心化计算还面临网络带宽的限制。对于需要多节点训练的大模型,物理网络基础设施至关重要。数据传输速度、同步开销以及对特定分布式训练算法的支持,都需要特殊的网络配置和定制通信方案。在大规模集群中以去中心化方式实现这点是极为困难的。
综上所述,去中心化计算(及存储)要在长期取得成功,必须直面来自中央化云服务提供商的激烈竞争,其市场普及将是一个漫长而曲折的过程,时间跨度可能不亚于云计算的普及历程。考虑到去中心化网络开发所涉及的技术复杂性,以及开发及销售团队在可扩展性方面的不匹配,要全面实现去中心化计算的宏伟愿景是充满挑战的。
输出验证与信任
随着人工智能技术在日常生活中的深入应用,公众对AI模型输出质量和潜在偏见的关注度日益提高。一些加密项目正在探索基于去中心化市场机制的解决方案以应对这一挑战。这些项目致力于开发一套算法体系,旨在对各类 AI 输出进行全面评估。然而,由于模型基准测试本身存在固有难度,加之成本、性能和质量之间的复杂权衡关系,要在不同模型间进行直接比较仍面临诸多挑战。
BitTensor 作为该领域内规模最大的 AI 导向型加密项目之一,正积极寻求突破这些瓶颈。BitTensor 试图利用其子网系统建立智能市场生态,通过 32 个子网来激励不同类型的智能行为,旨在用精心设计的约束条件从信息提供者那里提取有价值的智能输出,以应对传统基准测试面临的一些挑战。
以其旗舰子网 1 为例,该子网主要围绕文本提示展开竞争,奖励能够针对验证者发送的提示生成最佳文本响应的矿工。响应的质量由子网中的其他验证者进行评判。这种机制建立起了初步的智能经济,网络参与者会在各种市场中竞相创建和优化模型。然而,这种验证和奖励机制仍处于早期阶段,面临着诸多挑战。如易受到对抗攻击、处理主观领域(如语言和艺术)输出时难以建立客观的评估标准等。具体到子网 1,其验证机制要求验证者生成一个或多个参考答案,并将所有矿工的响应与之进行比较,与参考答案最相似的响应将获得最多奖励。当前的相似性算法采用字符串字面匹配和语义匹配的组合作为奖励标准,可能难以兼顾多种风格偏好。
图9 BitTensor 子网 1 说明 | 图源:BitTensor
BitTensor 激励结构所产生的模型能否最终超越中心化模型(或顶级模型是否会迁移到该平台)、如何平衡模型规模和计算成本等问题目前也还没有明确的答案。总的来说,BitTensor 的目标是通过其激励机制来优化 AI 模型的开发和使用,从而实现资源的有效分配。但要注意,理论上,一个允许用户自主选择模型的自由市场藉由“看不见的手”也可能自发地实现资源的有效分配。换句话说,复杂的去中心化激励系统可能并不比一个简单的、由用户自由选择驱动的市场更有效。
不可否认,BitTensor 是在不断扩大的问题空间中尝试解决极具挑战性的问题,但其在短期内的广泛应用仍面临着诸多障碍。
与此同时,免信任模型推理技术——即证明模型输出确实源自所声称的特定模型——也成为加密与 AI 交叉领域的另一个研究热点。然而,随着开源模型逐渐向小型化、轻量化方向发展,以及个人计算设备性能的持续提升,此类解决方案可能面临需求侧的挑战。在当前技术环境下,用户已经可以下载模型并在本地设备上运行,同时通过、文件哈希或校验和方法来验证内容完整性。在此背景下,免信任推理技术的必要性和实际应用价值可能会受到质疑。诚然,许多大语言模型由于其复杂性和资源需求,目前仍无法在智能手机等轻量级设备上进行训练和操作,但值得注意的是,一台配置较高的台式计算机已经具备运行多种高性能 AI 模型的能力。
这一趋势凸显了 AI 技术的快速发展和普及,同时也引发了我们对未来 AI 应用场景和相关技术需求的深度思考。在这个 AI 能力不断下沉的时代,如何平衡技术创新、用户需求和安全性考量,将成为推动 AI+加密领域持续发展的关键因素。
数据来源与身份
在人工智能技术迅猛发展的今天,生成式 AI 的输出正日益接近人类创作水平,甚至在某些领域已难以区分。这一趋势引发了社会各界对 AI 生成内容追踪和识别的广泛关注。数据显示,GPT-4 通过图灵测试的概率已是 GPT-3.5 的三倍,这表明我们可能即将步入一个在线互动中“难辨人机”的新时代。在这样的背景下,验证在线用户的真实身份以及为 AI 生成内容添加可识别标记,已成为亟待解决的关键技术问题。
为应对这一挑战,去中心化身份识别系统和类似 Worldcoin 的“人性证明”机制应运而生,旨在通过区块链技术准确识别人类用户。同时,将数据哈希值记录于区块链也为内容溯源提供了可能,有助于验证内容的创建时间和来源。但与之前的问题类似,我们需要审慎权衡加密解决方案与中心化替代方案的可行性和效率。
中国的在线身份已经与政府管控的数据库进行了关联。全球其他地区的中心化程度虽不及此,但由 KYC 服务提供商组成的联盟也有能力提供独立于区块链技术的“人性证明”解决方案,其模式与保障互联网安全的可信证书颁发机构体系相类似。
与此同时,AI 水印技术研究也在不断推进。该技术旨在于文本和图像输出中嵌入隐藏信号,使算法能够检测内容是否由 AI 生成。多家领先的 AI 公司,包括微软、Anthropic 和亚马逊,已公开承诺为其生成的内容添加此类水印,显示了业界对内容真实性和可追溯性的重视。
此外,许多现有的内容提供平台出于合规需求,已经建立了严格的内容元数据记录系统。尽管此类数据通常采用中心化方式存储,用户仍倾向于信任与社交媒体相关的元数据信息(如发布时间、作者身份、编辑记录等)。需要强调的是,任何基于加密技术的数据溯源和身份验证解决方案,要想真正发挥作用,还需要与用户日常使用的平台深度整合。因此,尽管基于加密技术的身份验证和数据溯源方案在技术层面上是可行的,但其广泛采用却并非必然。这一过程将受到商业考量、合规要求以及监管政策等多重因素的影响和制约。
AI 代币观察
自 2023 年第四季度以来,尽管面临前文所述的各种挑战,许多 AI 相关的加密货币却展现出了超越比特币、以太坊,甚至超过英伟达和微软等 AI 板块龙头股票的市场表现。AI 代币一方面受益于整体加密货币市场的强劲势头;另一方面,也从频繁出现的 AI 相关新闻中获得了额外的关注度和投资热情。这两大因素的共同作用,支撑起了 AI 代币的强劲叙事。
这种独特的市场地位使得 AI 代币呈现出与传统加密货币不同的价格走势。即便在比特币价格下跌的时期,专注于 AI 的代币仍有可能经历上涨,从而在整体市场低迷时期展现出上行波动性。
然而,从长远来看,仍应对 AI 叙事交易的可持续性持谨慎态度。目前,这个领域缺乏明确的采用预测和可靠的效用指标,这为各种 Meme 投机提供了土壤,但这类市场行为可能难以长期维系。代币的价格最终必将与其实际效用趋于一致——关键问题在于这一过程需要多长时间,以及究竟是效用提升以匹配当前价格,还是价格回落以反映实际价值。
总的来说,AI 与加密货币的交叉领域正处于一个充满动态和不确定性的发展阶段。市场的短期波动可能会持续一段时间,但长远来看,那些能够展示实际应用价值、解决现实问题的项目才能在这个快速演进的领域中脱颖而出,赢得持续的市场认可和投资者信心。
结论
在技术进步开启的新时代里,AI 代表了先进的生产力,数据和算力是最核心的生产资料,而区块链和加密技术则带来了全新的生产组织方式。问题在于,在加密技术成熟度不足、相关法律和监管框架滞后的现阶段,AI 真的需要变更现有的生产组织方式采用加密解决方案吗?
加密技术在 AI 领域的应用不能只是空中楼阁,还需要面对现实的考验。去中心化平台的发展必须面对已有的中心化解决方案的竞争,并在更广阔的商业环境和监管框架下接受评估。仅仅为了追求所谓“去中心化”是不足以推动大规模应用的,更遑论颠覆和取代现有的中心化服务提供商。况且,在市场竞争和开源平台的推动下,AI 行业目前其实已经实现了一定程度的去中心化。
加密解决方案虽然理论上可行,但要达到与成熟的中心化平台相当的功能水平,仍需投入大量的资源和时间。而与此同时,中心化平台也不会停滞不前。去中心化系统需要共识的特性决定了其开发推进速度通常会比中心化开发更慢,这一点在 AI 这样快速迭代的领域会显得尤为致命。
总的来说,AI 和加密技术的交叉领域整体仍处于初期阶段,整个市场充满了变数,其发展轨迹可能会随着 AI 行业的演进而快速变化,而 AI 行业本身的未来走向也还未明确。因此,投资者和开发者需要更深入地研究基于加密技术的解决方案如何才能提供独特的价值,或者至少充分理解潜在的市场叙事及其背后的驱动因素。“AI × 加密”代表了一个充满机遇和挑战的新前沿,成功的关键在于在技术创新、市场需求和监管合规之间找到平衡点,同时保持对行业动态的敏锐洞察力。只有那些能够切实解决实际问题、创造真实价值的项目,才能在这个快速演变的生态系统中站稳脚跟,并最终推动整个行业向前发展。