当前位置:首页 > 科技资讯 > 正文

Sakana AI 1亿美元融资,日本本土大模型竞赛升温

智东西今日报道,据The Information援引知情人士透露,OpenAI的日本竞争对手Sakana AI正筹备以25亿美元(约合人民币178亿元)的估值筹集1亿美元(约合人民币7亿元),较去年9月的15亿美元(约合人民币107亿元)估值增长66%。

据悉,Sakana AI目前正与美国和日本投资者进行磋商,成功筹集这笔资金后,其估值将攀升至26亿美元(约合人民币185亿元)。该公司计划借此机会扩大其工程、销售和分销团队,目前其员工人数约为70人。

成立于2023年7月的Sakana AI,其创始团队可谓星光熠熠。David Ha曾任谷歌大脑高级科学家,并领导过图像生成模型独角兽Stability AI的研究部门;另一位创始人Llion Jones则是Transformer论文的合著者及前谷歌AI研究员。今年8月,David Ha还荣登《时代》杂志发布的2025年百大AI人物榜单。

Sakana AI 1亿美元融资,日本本土大模型竞赛升温 大模型 日本本土 创新 第1张

Sakana AI创始人Llion Jones(左)、David Ha(右)

与OpenAI、Anthropic等企业不同,Sakana AI致力于摒弃Transformer架构,寻求以自然进化为灵感来降低模型计算成本并提升性能。产品方面,该公司已推出三款日语模型、江户古风聊天机器人Karamaru以及开源框架ShinkaEvolve。

截至目前,Sakana AI共筹集资金近2.3亿美元(约合人民币16亿元)。其中,2024年1月获得45亿日元(约合人民币2亿元)融资,由Lux Capital、Khosla Ventures、日本电信公司NTT及索尼集团投资;去年9月完成2.14亿美元(约合人民币15亿元)A轮融资,英伟达参投成为大股东,使其成立一年估值达到约15亿美元(约合人民币107亿元),迅速跻身独角兽行列。

此外,据The Information报道,该公司还获得日本政府拨款用于购买AI训练所需的计算资源。

Sakana AI在日语中意为“鱼”,Ha曾向The Information透露,他旨在建立一个“日本的DeepMind”。

Ha表示,其算法能够协助企业自动生成处理语言或图像的大型模型,实现方法是在组合、测试和丢弃数据时模仿自然选择的规律,从而减少所需的人工输入量。鉴于训练大模型所需的电力和资源消耗巨大,他期望将训练时间缩短至几天或几周。

具体而言,Sakana AI采用将三种开源原始AI模型作为“父母”,通过不同方式“养育”超百名“子女”,随后筛选出表现最优的模型再生成下一代,并持续重复此过程,最终从数百代模型中选出佼佼者。

今年3月,Sakana AI发布三款日语模型,包括大语言模型EvoLLM-JP、视觉语言模型EvoVLM-JP和图像生成模型EvoSDXL-JP。

一个月后,Sakana AI推出江户古风聊天机器人Karamaru,该机器人能以江户时代的世界观和古代文献来回答用户问题,其训练数据源自该公司从江户时代书籍中建立的约含2500万个字符的数据集。

今年9月,Sakana AI开源了ShinkaEvolve框架,该框架将大模型与一种算法相结合,针对各种潜在问题提出解决方案并缩小到最相近的问题。该公司声称,与Transformer架构相比,这种方法更高效且更具创造性。

Sakana AI 1亿美元融资,日本本土大模型竞赛升温 大模型 日本本土 创新 第2张

截至目前,Sakana AI已与多家日本大公司签订合作协议。

今年5月,该公司宣布与三菱日联金融集团建立多年合作伙伴关系,为日本最大银行开发定制AI模型。据Ha透露,此交易将使Sakana AI在一年内实现盈利;本月早些时候,Sakana AI宣布与日本最大券商之一大和证券集团建立类似合作关系。

Ha指出,任何希望拥有自己基础模型的日本公司都可以与Sakana AI或其他类似公司合作开发模式,日本在创新方面仍有发展空间。

此外,在日本市场,Sakana AI还面临众多美国大模型开发商的激烈竞争。

今年2月,OpenAI宣布与软银建立合作关系,软银同意每年为其自身及其子公司花费30亿美元(约合人民币214亿元)购买OpenAI的技术,双方还将成立一家合资企业专门向日本公司销售OpenAI工具套件;Anthropic在今年8月任命日本国家负责人并计划在东京开设办事处;同年8月加拿大大模型创企Cohere聘请了一名日本国家经理。

结语:Sakana AI专注日本本土大模型

与法国大模型创企Mistral AI、印度大模型创企Krutrim类似,Sakana AI致力于开发自己的大模型并更好地掌握本地区语言和文化以减少对其他AI技术的依赖。Ha认为对日本公司而言拥有自己基础模型是明智之举即便它不是超高性能模型。

尽管相比OpenAI、Anthropic、谷歌等大模型核心玩家这些创企在资金和人才实力上稍显不足但仍需通过算法等创新寻找突破路径。