Z Potentials 2025-10-21 22:01 四川

🌟 Meshy 以“用文字或图片生成 3D 模型”为核心功能,通过先进的 AI 技术,将文本提示或图片快速转化为精细的 3D 模型,极大提升了内容创作的效率。
🚀 Meshy 6 版本在几何结构和细节精度方面实现飞跃式提升,空间分辨率三轴翻倍,整体细节提升约 8 倍,尤其在角色和精细物体生成效果上处于市场领先地位。
🛠️ Meshy 提供文本生成 3D、图像生成 3D、贴图生成、动画以及 API 接口等功能,满足从入门用户到专业创作者的不同需求,并提供可扩展的工作流支持。
Z Potentials 2025-10-21 22:01 四川
从学术到创业:
从“造世界”到“造产品”的底层跃迁
ZP:请先介绍一下您的成长经历,包括求学阶段(清华姚班本科;MIT 博士)以及您在图形学、物理仿真方面的早期科研与学习,是如何锻造您在技术与市场机会上的敏感性的?胡渊鸣:我是江苏扬州人,家里是知识分子家庭。小时候其实很难想象自己会去创业。长辈对我的期待更像是和他们一样成为大学老师或者科研人员。家庭对我最大的影响是做事认真、务实和勤奋。我很多年后才发现:原来不是所有的父母在几乎所有醒着的时间都在工作的,而我父母的工作在生活中的占比是很高的。我很早就开始接触编程,小学时因为喜欢玩游戏,就想做自己的游戏,于是开始写代码。到高中时拿了 NOI(全国青少年信息学奥林匹克竞赛)金牌,后来被保送清华,再后来考试考到了姚班。可能每一个清华同学都会有的一个人生阶段是,发现人和人的差距比人和草履虫的差距更大。清华的同学都非常优秀,我在姚班认识了一批很厉害的同学,对我做事情以及志向方面都设立了一个很高的标准。这些同学中后来也有很多人成为了教授或者创业者,而我其实算不上这其中最优秀的那一批人,所以总是被周围同学激励着。博士阶段我去了 MIT,主要研究图形学(这是我非常感兴趣的一个方向)、物理仿真和计算系统,这为我之后的工作打下了坚实基础,因为我确实是一个喜欢钻研技术的人。但其实那时候我缺少了对市场这方面的理解,我的知识分子家庭的背景也没有给我提供这方面的经验。坦白来说真正让我开始关注市场和创业,是在 MIT 读 Ph.D. 的时候在 YouTube 上看到很多创业者的视频。比如极客公园张鹏访谈的王兴,还有雷军介绍创业的一些视频等等。这些视频让我大概知道有一个企业家这样的群体存在。他们能够通过创新去解决一些社会上存在的问题,为用户创造价值,这个想法在我快毕业的那个时候非常吸引我。那时是疫情期间,我对外界的交流很受限,我更强烈地意识到我不想一直只在实验室里做研究工作,而是希望做一些能真正让很多人真正用起来的东西。这种想法推动我后来去做“太极(Taichi)”编程语言,以及之后的创业探索。十几年来我一直是在想做东西给自己和别人用,而产品方面的能力在读书的时候并不是我的强项。后来在做 Taichi 和创业的过程中,我的产品能力才慢慢锻炼出来。我相对于其它技术出身的创始人的一个优势是我的同理心会更强一些。即使深度参与产品开发当中,我也能把自己抽离到用户视角,去体会普通的用户用某个功能是否会觉得很丝滑,还是很不顺畅。这种对体验的关注和追求对我们做一个好用的产品有挺多帮助。在设计太极编程语言的时候,我自己就兼任了产品经理、研究、工程、市场等工作。这个过程其实对我是一个很好的锻炼,也是创业的预演。ZP:您身边很多同学选择学术道路,而您从科研转向创业,是出于怎样的原因?胡渊鸣:我一直是一个好奇心很重的人,喜欢尝试新的东西,这种好奇心伴随我的整个成长过程,也驱使我开始做计算机图形学。最早因为玩游戏,我就好奇游戏是怎么渲染出好看的画面,于是沿着这个好奇心就想自己做一个游戏出来。这个过程中,我又觉得 GPU 上的编程语言为什么都不大好用,基于好奇心就想着自己能不能设计一个更好用的语言,这就有了太极编程语言的尝试,后来又在思考是不是能够做一个可持续运营的公司,来实现更大的目标。一路走来,有成功的,也有失败的,但我就是喜欢折腾。和很多同学选择学术舒适区不同,我更想做点新的、能真正被人用起来的东西。ZP:在博士或早年科研阶段,您做过哪些项目或成果让您看到了“图形学+系统+高性能”的结合可能带来产品级别的创新?这些经历具体怎样影响了您作为创业者的思考框架与判断能力?胡渊鸣:我认为图形学和物理仿真的核心魅力在于,它们能让你在计算机里创造一个虚拟的世界。这种兴趣我从小就有,我常常思考世界是由什么组成的、如何运行的。我经常想:如果我能掌握世界的底层规律,是否我也能创造出和现实一样的栩栩如生的模拟环境?在我的认知之内,我发现图形学正好能回答这个问题:我们知道光线传播的规律,就能渲染非常逼真的画面;知道粒子如何相互作用,就能模拟物理特效。我的这些探索背后,一句话总结其实都是源于自己对“世界如何运行”的好奇心。太极语言就是这种思考的产物。当时我既做研发、也做产品经理、市场和推广,相当于一个人扮演多个角色。这段经历锻炼了我对完整产品链路的把控,也让我逐渐培养了对用户体验的敏感性。ZP:当初从学术界转向创业,尤其是创办太极图形时,您对商业化有哪些期待?现实中遇到的落差又是什么?胡渊鸣:最初我希望能把太极编程语言商业化,但后来发现这条路并不好走。太极语言这个项目仍在维护中,但它没有形成特别好的商业模式。真正的商业化机会,后来反而是来自我们新的项目 Meshy。ZP:创业过程中有过哪些让您觉得“必须杀死过去的自己”的关键节点?这些节点如何改变了您的思考方式、执行方式或团队管理方式?胡渊鸣:其实这其中有很多次的挫折和失败让我不得不反思。举个例子,我们在太极之后做过第二个产品——一个渲染器。当时认为这种渲染器产品有一定的市场,因为我们可以用全新的技术(云端 GPU 渲染)切入用户广泛使用的已有的市场,觉得能分一杯羹。但后来发现,这个想法只是表面可行。实际上这个市场本身已经在萎缩,用户量本身就在下降加之用户逐渐老龄化,他们对于新技术的接受度没有那么强了,而新用户几乎没有。哪怕技术有改进,只是一般的颠覆性也难以撬动用户从老产品切换到新产品。所以最后这个项目失败了。但这次经历让我学到两个关键点:第一,创业要选新兴的增长型的大市场,而不是收缩中的旧市场。第二,用户反馈很宝贵。在做这个项目的过程中有用户对我们说:“我不会为你的软件付费,但如果你能提供 3D 资产库,我会为此付钱。”这让我意识到 3D 资产本身比 3D 工具更有价值。再加上 ChatGPT 等生成式 AI 技术的启发,我们才决定去做 Meshy。这其实是一个思维方式的转变。以前是从技术出发,找落地场景;后来变成从用户需求出发,再匹配技术。哪怕需求听起来很“low”或不够宏大,比如用户只是想要 3D 资产,但这是真实需求,值得被满足。我业余时间会去看一些企业家的传记。比如任天堂的成长经历中就有很多有意思的事情。横井军平在做 Game Boy 的时候,有一个理论叫做“枯萎技术的水平思考”。他的思维方式还挺反直觉的,因为技术从业者很多时候都在追求一些新的技术,但其实一个产品能解决用户的问题是更重要的。在横井军平设计 Game Boy 时,竞争对手都在用彩色液晶屏,而他在用黑白液晶屏。横井军平认为用黑白液晶屏的话四节电池能玩 15 小时,如果换成彩色屏,六节电池才能玩六个小时,带给用户的续航体验是完全不一样的。当世嘉认为任天堂 “在用过时的黑白液晶屏技术” 的时候,横井军平认为 “世嘉只要用彩色屏幕就一定输了。”很多时候需要有所取舍,对于尖端技术的追求肯定是有效的,但对于解决用户问题的商业思考上,二者一定要达到一个好的平衡,产品设计本身就是一个持续不断的且精密的思考过程,有大量的局部细节和全局目标需要统筹规划。重塑3D生产力:从“分钟级生成”
到产业级落地的Meshy范式
ZP:在当前 AI 生成 3D(Text-to-3D, Image-to-3D, Texturing, Animation)大潮中,您是如何定位 Meshy.AI 的?从您观察到的市场痛点与技术瓶颈中,您认为最迫切需要解决的问题是什么?胡渊鸣:Meshy 的定位其实很简单,一句话就是“把文字和图片变成 3D 模型”。以前游戏公司做一个模型大概需要两周时间、1000 美元成本;现在通过 Meshy,两分钟、1 美元就能完成。速度上提高了一千倍,这是一个质的飞跃。目前最大的挑战还是质量问题。虽然生成速度和成本优势很大,但和专业艺术家手工建模相比,AI 生成模型的质量还是有比较大的差距,没办法直接无修改地投入到游戏中使用。这里的问题包括:几何结构不够精确、UV/拓扑质量欠佳、材质和贴图的细节不足,以及可控性不强。这些都需要通过持续的技术迭代去改善。目前一些场景是可以用的,比如作为一个独立游戏的原型,但对质量要求高的地方还是需要人工来做调整之后才能应用到游戏里。在不确定中前行:
从技术信仰到全球化执行的创业进化论
ZP:您认为在 3-5 年内,Meshy 的产品与市场会经历哪些阶段性的突破?(例如:质量门槛、渲染/实时化、引擎集成、VR/AR/元宇宙入口等)胡渊鸣:我觉得能做的事情非常多。比如生成完整的 3D 场景,也就是多个物体的组合;再比如提升在游戏管线中的适配程度,包括几何拓扑、UV、材质质量等。我们还不断给产品加入新的 Workflow。比如我们最近推出的 3D to Video 的功能,让用户可以把 Meshy 的 3D 模型组成可编辑的 3D 场景,并把这些 3D 场景变成图片、视频。沿着 3D 上下游有非常多可以去做的事情。当你的产品有一些用户后,总可以做出新功能来满足他们的需求。我们未来的迭代方向包括:提升生成质量、优化上下游流程、增强可控性等。AI 生成可交互 3D 内容是一个趋势,但现在仍处在探索阶段,还不能替代成熟的实时引擎。不过我相信这是未来很有潜力的方向。ZP:在国际化战略上,尤其对于非英语市场(中文、其他语言),Meshy 是怎样规划界面、本地化、用户社群与支持等?这些方面对产品增长的影响有多大?胡渊鸣:我们的界面设计从一开始就是国际化的,切换不同语言相对容易,本地化主要是提示词翻译等问题。回过头来看,我们的界面设计在整个 3D AI 行业是非常领先的。目前我们还是专注海外市场,尤其是欧美市场,因为那里的付费意愿偏强一些。未来我们会继续国际化。虽然一些海外国家人口规模不大,但游戏和软件产业非常成熟,生态更健康,也有很大空间。ZP:您怎么看行业内竞争对手(如其他 Text-to-3D 或 Image-to-3D 的 AI 工具/开源项目/大型 AI 实验室)Meshy 的护城河在哪里?胡渊鸣:我觉得要分几类。一些项目看起来是竞争,但实际上更像合作伙伴。开源模型的生成质量目前和闭源还有很大差距,但开源确实推动了学术和产业的探索,我们也会吸收其中好的想法到我们自己的产品当中。我们还设立了 Meshy 奖学金,每年发给为产业界贡献了新想法的在读学生。至于大公司,它们拥有的资源肯定会比我们多。比如 Google、NVIDIA、OpenAI,他们都曾在某个阶段做过 3D,但很多最后都停止了,甚至成为了我们的客户,比如 Meta。腾讯可能是依然在这个方向有较大投入的公司。相比大公司,创业公司的优势在于专注和决策效率高。我们的团队速度快、每个人的责任感和 ownership 都很强。在和用户关系上,创业公司也更灵活,比如 CEO 可以直接参与客户沟通,这是大公司很难做到的。海外用户对创业公司通常也更友好。所以我认为 Meshy 的护城河主要在三个方面:1. 专注与坚持:我们是现在 3D 生成玩家中最早入局的,并且持续迭代,具有先发优势。2. 团队执行力:扁平的小团队能快速决策、快速试错、快速迭代。3. 用户关系和品牌:用户其实愿意和创业公司一起成长,而大公司往往显得“店大欺客”。ZP:在从“太极图形”向“Meshy.AI”转型过程中,您遇到过哪些最难克服的瓶颈?您是如何决策并调整方向的? 胡渊鸣:有一些时刻其实我自己也不确定未来的方向,但必须要下注。比如我们最初在太极的基础上尝试 NeRF(神经辐射场)技术,当时有两条路线:一条是用它做重建,一条是做生成。我们判断生成会是更大的市场,所以决定往生成方向走。这个决策当时团队内部也没有共识,有些人觉得应该做重建。为了推动大家达成共识,我做了大量沟通。当时市面上几乎没有公开可用的 3D 生成产品。我们决定快速上线,即使产品质量不高,也要先跑通用户验证。我记得第一个版本用了 8 个小时,也就是早上 10 点开会,晚上 6 点就上线了。一天之内有 1000 个用户注册,这给了我们很大的信心。在小步快跑的试错过程中也“被怀疑过”:初期很多用户觉得生成的东西“不靠谱”,甚至由于最初的生成质量不是很好,第一个把 Meshy 用在游戏中的场景是“用 Meshy 来做恐怖游戏的素材”。但随着基础模型不断迭代,用户逐渐改变了自己的看法。这段经历让我体会到:在怀疑和不确定中保持信念和深度思考,并通过小步快跑的数据验证,就能带领团队不断地看到希望,一步步看清未来。ZP:领导力与团队管理上,从一个研究者/技术人的身份进入 CEO 角色,您最需要提升或改变的是什么?有没有某些领导风格、组织制度上的经验教训可以分享?胡渊鸣:我认为这个问题的核心是 CEO 到底在公司里面应该扮演什么样的角色。CEO(“首席执行官”)这个角色名字有点误导,但实际上,CEO 最重要的任务不是自己去执行,而是确保整个公司能赢。在产品与市场匹配之前,我作为 CEO 还要亲自写代码、调参数、做产品。但当团队扩大后,我写代码的边际价值很低,更重要的是思考团队如何整体运作。所以我的最大的转变是思维方式:从“我能做什么”变成每时每刻去想“团队能做什么”。会去思考哪一项工作是能给团队带来最大价值的。所以我认为 CEO 要做的是:能够做出决策来保证战略能落地;能够提出更高标准,注重培养团队;知道该如何把合适的人放到合适的位置上,让擅长技术的人做专家,让擅长管理的人带团队。从关注事情和技术细节转向关注人,这个转变是我最大的成长。ZP:在承受外部期望(被标榜为“天才少年”、行业焦点、舆论关注等)与内部产品真实质量/用户反馈之间,您如何处理那些矛盾?对外讲故事 vs 对内专注交付,这两者怎样平衡?胡渊鸣:我觉得首先要做到坦诚,就是自己是一个什么样的人应该心中有数,不能去对外宣传自己没有做到的东西,因为一旦一个组织的 CEO 开始不坦诚,那么整个组织的文化都会被破坏。在我看来,“对外讲故事”和“对内专注交付”不是对立的,而是一回事。因为讲出的故事是对未来的愿景描述,但必须是符合第一性原理和技术发展逻辑的,并且自己要真心相信。只有这样,故事才是讲得通的,才能把团队和用户凝聚在一起。真正的挑战是:你必须不断交付,去验证你的故事是对的。故事不是“吹牛”,而是愿景加验证过程。所以我不觉得这两者有矛盾。ZP:创业过程中有没有“几乎放弃”的时刻?当产品用户体验不达标、或技术瓶颈显著时,是如何保持信念与执行力的?胡渊鸣:有的。比如前两个产品(太极语言和渲染器产品)都没能成功,再加上当时家里老人去世,压力特别大。那时候我甚至想过把钱退还给投资人。后来和一些创业者交流,他们很坦诚地说,这些失败很正常,他们惨的时候比我惨多了。创业本来就是要做好经历失败的准备。慢慢地,我重新找回了信心。经过这几年的“濒死体验”和摸爬滚打,我更清楚地认识了自己,也更能坦然面对自己的优点和缺点。和团队沟通时,我也会直接承认哪里做得不好或不对,需要调整。我认为这些磨练对于一个人和一个团队是相当必要的,如果一直都很顺利的话,是没办法有更深层次的认知的。ZP:如果让您给希望在 AI 生成 3D 方向创业或产品设计的年轻创始者一个忠告,您最想强调哪两点?胡渊鸣:首先我不认为我们已经发展到特别好的程度足够给他们建议,只能说我学到了两点比较重要。第一点是面对现实,要看清楚用户是否真的有需求,收入是一次性的还是有留存的,用户是否真正把产品用到了生产过程中,不要被暂时的假象迷惑,更不要自欺欺人。第二点是保持勇敢,当你能够面对现实之后,就有勇气面对失败,你就会接受失败并从中快速学习,就能不断迭代,甚至越挫越勇。只要学得够快,总有一天会成功。只要还在尝试,就在通往成功的路上。ZP:您平时关注的几个 AI/图形/生成式内容创业公司里有哪几家您觉得做得好?它们给您带来了什么启发?胡渊鸣:可能有些俗套,但我觉得 OpenAI 还是非常值得学习的公司。它的早期领导人 Ilya 坚持第一性原理的思考方式,比如认为智能水平与神经元数量成正比,人工神经网络和生物神经网络没有本质区别。以前的计算机可以模拟出老鼠大脑中的神经元数目,那如果把神经元的数目逐渐变大,它的智能水平就能接近猴子,甚至接近人类。这些最底层的思考支撑了他们走上 AGI 的道路,尽管经历了多次失败。OpenAI 15 年公司成立,但七年后(22 年)才做出出圈的成果 ChatGPT。另外我很欣赏 Epics Game(ZP 注:一家美国电子游戏与软件开发公司,创立于 1991 年,公司总部位于北卡罗来纳州卡里镇)。他们不仅做了虚幻引擎,还开发了《Fortnite》这款游戏,这是巨大的商业成功案例。虚幻引擎是整个图形学和人类视觉技术的集大成之作。应用层公司里,我觉得 Lovable 和 Cursor 做得很好。他们抓住了用户真实的需求,找到了 AI 与已有的工作流程结合的场景,找到大市场并切入。我自己写代码时也会用 Cursor,Lovable 的原型功能也非常好。这些案例说明,只要找到足够大的机会,把 AI 与真实场景结合,潜力是巨大的。ZP:最近有没有什么书、论文或者个人影响很深的作品/艺术家,让您在美学/技术/产品思考上有新的顿悟?胡渊鸣:对我影响很大的人是马斯克。虽然他作为老板可能很严苛,但他的执行力和第一性原理思考方式非常值得学习。在金融危机时,SpaceX 和 Tesla 都快撑不下去了,但他依然坚持两条线都做,现在两家公司都非常成功。我自己也开 Tesla 的车,觉得它的 FSD 是目前最好的自动驾驶系统。马斯克的特别之处在于:他既能讲出宏大的愿景故事,又能真正交付结果。这两点同时做到的人非常少。他对我启发很大。推荐阅读
长按识别二维码,备注“白鲸”申请加入白鲸社群,获取更多资讯、活动、资源
AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。
鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑