原创 Z Potentials 2025-09-18 10:41 美国
生物数据的混乱与AI的秩序:一场AI引发的生命科学基础设施的重塑。
在生命科学的浩瀚实验室里,数据洪流正以前所未有的速度涌来——基因测序成本以超过摩尔定律的速度,在二十年间断崖式下降了18万倍,而数据量却呈指数级暴增超过亿倍——但科学家们仍被困在原始的工作范式里:手动检索海量文献、反复跨部门沟通需求、苦等数周乃至数月的分析结果。硅谷出身的Ashton Teng与Quinn Leng携手创立Kepler,他们试图用AI Agent重构科研的底层工作流:“我们正在设计的,是科学史上从未有过的‘人与AI交互’方式。”
两人因对AI的好奇相识。三年前,Quinn在研究LLM“幻觉”问题时,、短暂尝试过用AI做“解梦和塔罗”,在朋友的引荐下,他认识了同样痴迷前沿科技的Ashton。最初他们只是一起滑雪、潜水、闲聊人生,没想到逐渐在创业想法上高度契合——如何从零开始、什么才真正有价值。直到去年,两人几乎在同一时间决定离职创业,“身边有一个你信任、并且在同一时间准备好的人,是非常难得的。”Ashton回忆。于是,Kepler从一段友谊的延伸,成长为一个AI for Science的实验场。
Kepler选择的切入口是生命科学场景。“生物领域的数据分析能力,远远落后于科技行业。”Ashton直言。他从神经科学跨入生物信息学,又在GRAIL、Foresite Labs和Xaira Therapeutics等技术驱动的生物科技公司深耕多年,几乎亲眼见证了科技推动生命科学的路径,也深知其中的短板:“实验完成后,科学家往往要等待数天甚至数周,才能拿到生物信息学分析结果。这大大拖慢了科学迭代的周期。”
而Kepler的使命,正是成为“研究组织的中枢神经系统”。Ashton解释,它不仅能帮科学家查询文献、生成实验想法,还能连接数据流水线、结合实验元数据与生物数据进行分析,并将结果与企业既有知识体系关联,辅助得出结论、生成报告,甚至提出下一步研究问题。换句话说,Kepler并不只是一个工具,而更像一个端到端的Scientist,甚至还能做传统方式根本无法实现的事:它可以同时发起上百个问题,与数据进行批量交互,从而更快、更广地探索潜在发现。
尽管OpenAI等通用模型巨头环伺,Kepler却展现出十足的底气。Ashton一针见血地指出:“通用厂商解决不了‘最后一公里’问题——他们不会深入企业去整合具体工作流程。”这种自信很快得到了市场验证:成立仅第一周,Kepler便成功斩获首家生物科技客户,印证了生物科技领域对专业AI解决方案的迫切需求。
这种专业深耕的优势在技术层面得到了量化印证:通过深度整合专业工具与数据源,并结合高度优化的深度思考与实验流程规划能力,Kepler在生物信息处理权威基准测试Bixbench (https://arxiv.org/abs/2503.00096) 中,以33.4%的准确率超越所有通用及行业Agent(包括GPT-5、Claude-opus-4.1、K-dense analyst及Drylab),展现了垂直领域技术壁垒。
更深刻的行业转变正在发生。Ashton和Quinn透露,AI转型已成为药厂竞争的关键指标,“以往大药厂从不青睐初创,但现在,窗口期打开了。”药企竞争日趋白热化,能否快速实现AI转型直接决定竞争力。然而,大药厂虽能招募人才,却因并非AI原生企业,内部开发工具往往受限于速度与通用性,只能满足局部需求,缺乏专业产品的可靠性与扩展性。正是这一结构性短板,催生了前所未有的合作机遇——顶级药厂开始主动评估并与AI初创合作,这在过去几乎难以想象。对Kepler而言,这是一个技术变量催生出的全新机会,更预示着生命科学的数字化变革正进入深水区。
Kepler的野心远不止于生物领域。“科学探索没有上限,”Ashton说,“材料、气候、农业……凡需研发之处,皆需AI之力。”而 Quinn 则用工程师的视角冷静勾勒未来:“我们面对的是业界最复杂的问题——处理百GB级多模态数据、设计可验证的AI决策流程,这一切尚无先例。”
在这场以科学为疆界的AI远征中,Kepler正以硅谷速度奔跑于无人区。他们也在用自己的文化筛选伙伴:自我驱动力、好奇心、客户痴迷,以及对AI工具的原生拥抱。正如Ashton所言:“我们不是AI for Science的专家,而是积极的参与者——每天都在发现新需求,这本身就很迷人。”
本期Z Potentials访谈系列,我们很荣幸邀请到Kepler两位联合创始人Ashton Teng与Quinn Leng,与我们分享他们的创业思考,Enjoy!
没有公司做过“科学家与AI Agent交互”的产品。比如,引用(Citation)应该精确到什么程度?Deep Research可以精确到某个网页,但我们需要精确到某次实验,甚至是数据库中的某一行,整个流程该如何做?Agent在哪些环节可以自主推进,哪些需要向科学家确认?这些都是全新的交互流程,需要我们重新设计。
他们内部其实早就规划和设计过,想要一个能用自然语言与数据交互的界面,但由于公司重心不在软件开发,自己实现困难太大;也考虑过找外包,但效果不理想。正好在这个时间点我们出现了,他们有数据,而我们有专业产品能力。
药企行业竞争激烈,现在能否快速实现AI转型已经成为重要的考核指标。尽管他们可以招募大量人才,但由于不是软件或AI原生企业,其文化氛围并非以AI为核心。因此内部开发工具的速度和通用性都存在局限,仅为内部使用的工具,很难像我们这样为众多公司提供服务的产品那样可靠和通用。
目前我们不太担心OpenAI或Anthropic这类通用AI公司,因为他们的定位是开发通用工具,而我们会针对生物领域的特定需求来优化模型功能。这些通用技术提供商存在“最后一公里”的问题,他们不会深入企业去整合具体工作流程。
就AI领域而言,传统软件提供商的创新速度跟不上发展,也缺乏优秀的AI产品。这创造了一个难得的机遇窗口:大药厂开始愿意与早期AI初创公司合作,这在过去是很少见的。以往都是先从小的生物科技公司做起,逐步发展壮大后再进入大药厂,但现在很多大药厂都愿意评估新兴的AI初创公司。
我们的长期愿景是成为每个研究组织的“中枢神经系统”。虽然目前专注于研究领域,特别是研究任务相关的AI Agents,但我们的技术可以拓展到其他科学领域,比如材料科学、气候科学、农业等,这些领域都有类似的研发需求。
虽然竞争激烈,但我认为不会有某家公司垄断整个市场,科学研究领域非常广阔,不像销售自动化等应用存在明显天花板。科学探索具有无限可能性,AI在这个领域的发展也没有上限,完全可以容纳多家公司共同发展。
01 深耕Tech Bio前沿,从科学梦想与商业视野的交汇点出发
ZP:请两位分别分享一下,在你们各自的职业生涯早期,有哪些关键的经历或项目,塑造了你们今天的创业决心?
Ashton Teng:我在北京和加拿大长大,从小就想当科学家,所以在上大学时,我在伯克利选择了神经科学和计算机专业。毕业时原本打算攻读神经科学博士,但大四的时候因为偶然多学了几门基因和分子生物学的课程,产生了浓厚的兴趣,并正好赶上基因数据指数型增长为相关应用产生了机会,就决定去斯坦福攻读信息学硕士。
从高中开始,我就对历史、经济和商业很感兴趣,日常读的书和看的新闻也更偏人文和商业方向。所以在大学期间,希望把科学和商业兴趣结合起来就加入了一些创业社团,其中对我影响最大的是伯克利的华人创业社团ACE。在那里,我就被硅谷创业氛围的“洗脑”,一直在思考创业的事情。但毕业之后,我还是决定先进入行业深造。
我先后加入了几家Tech Bio(技术驱动的生物科技)公司——GRAIL、Foresite Labs和Xaira Therapeutics。因为一直想创业,所以在本科去微软实习之后,我就再也没有想去过大公司。在这些创业公司里,我一直在摸索行业的前沿趋势——比如在GRAIL做的是癌症诊断,后来又去了AI药物开发的公司;这些公司的共通点都是需要海量的大数据。我一直都在寻找创业的机会,在一家公司学到东西后就会很快离开,甚至放弃了不少公司的股票。对我来说,成长是最重要的,而创业则是我继续成长、产生影响力的最佳选择。
其实当时癌症诊断和AI制药并没有被贴上“AI for Science”这个标签,大家更多是在解决非常具体的问题。比如癌症诊断就只聚焦在诊断本身,没有人说AI能渗透到科学工作者的日常中去。更多还是一些点对点的应用,像生物大模型也是近几年才兴起的。
所以上一轮的AI for Science更多是ML Application for Healthcare。上一轮浪潮确实有一些成果,比如GRAIL的产品就做得还不错,但它不像大模型出现后,大家觉得能带来如此巨大的影响,之前的应用还是更垂直的。我都是今年年初才听说“AI for Science”这个词的。
Quinn Leng:Ashton讲到小时候想当科学家,我小时候其实也是,不过更准确地说,是想当发明家——看动画片觉得发明家能马上创造出很厉害的东西特别酷。
我对工程的运行原理一直很感兴趣。小学二年级就把家里的电视机全拆了,零件都研究了一遍,然后又组装回去。我就是特别想看看里面到底长什么样、怎么跑的。后来我就一直会动手研究各种各样小东西。
大学我加入了华中科技大学的联创团队,在那里我们一起研究移动互联网APP、区块链、AI、分布式系统,甚至还和朋友一起开了一家公司。当时一起开公司的朋友中,现在有三个人是Manas的联合创始人。那时我就发现,科技推动这个世界的有两个方面:一是硬核科技(Deep Tech),二是如何把技术连接到用户手中。
后来我决定去CMU读硕士,研究了分布式系统、并发处理,甚至还有很多有趣的小项目——比如用可穿戴眼镜智能指导远程急救。毕业后我加入了Databricks,带领团队负责公司的计算和存储部分,经历了公司从一百人扩展到一万人的整个过程,认识到了整个过程中会遇到哪些问题、哪些是技术难点、学会了如何带团队、如何建立好的文化和实践。
在过去两年,我亲身参与并感受到AI对我们生活方方面面的影响,比如写作、聊天、编程等。我觉得这是一个非常独特的机会——AI第一次能够如此直接地渗透到生活的各个方面中。就像Ashton说的,之前机器学习更多解决具体问题,如今的AI可以把整体连接起来。这不仅是在技术上,在文化和企业结构上也会带来很多有趣的变化。我觉得这是建立一个AI Native(AI原生)公司的很好时机。
我自己一直对如何把技术发展得更进一步、把更深的技术连接到真正有价值的场景(比如企业或科学领域)非常感兴趣,所以很期待能创办一家这样的Deep Tech公司,在科学领域发挥价值。后来,我和Ashton就走到了一起。
ZP:你们两个是怎么结识,后来为什么一起决定开始创业,过程是什么?
Quinn Leng:我们认识快三年了。大约三年前ChatGPT刚出来时,我开始研究语言模型,当时遇到的一个很大问题是它容易“幻觉”(hallucination),会胡说八道,所以当时有很多研究课题是如何解决幻觉问题。我就想,这种特性是不是在某些场景下反而有用?比如娱乐方向的AI玄学——解梦、塔罗牌或算命。
后来我和当时的好朋友一起联合创立了一家公司(Dreamore AI),兼职做CTO,带领产品开发。虽然那不是我最热情的方向,但我觉得很有意思。就在那时,通过当时的联合创始人Coco,我认识了Ashton,也发现有这样一群硅谷华人对这个方向很感兴趣。
最初我们其实是因为朋友关系认识的,觉得这群人很有意思,有很多话题可以聊。后来我们一起滑雪、潜水、出去玩,跟工作完全没有关系。慢慢地,我们发现彼此在创业想法上也有很多共识,比如怎样从零做一家公司、什么才真正有价值,我们都在行业里工作过好几年了,知道做一件事情该如何切入等等,看法非常接近。后来就决定一起探索具体的方向。
去年我准备离职创业,当时觉得时机已经非常明确,于是我开始和身边的朋友聊,希望做一家深耕领域、面向企业的Deeptech公司。聊着聊着,就发现Ashton也有同样的想法。
Ashton Teng:我的新年愿望是离职创业,而Quinn也差不多在同时——可能是去年生日左右——有了同样的打算。身边能有一个你信任、并且也在类似时间准备好创业的人,是非常难得的。所以我们先确定了“一定要一起创业”,之后再决定具体做什么。
ZP:在招聘早期员工时,除了技术能力,你们最看重哪些特质?
Ashton Teng:这方面我们思考了挺久,总结了四点。第一点是self-motivation,也就是自我驱动力。这需要end-to-end ownership,做一件事情要有从头到尾全部完成;也需要responsibility,因为AI native的企业规模往往更精简,每个人都需要独立负责更多事务,很多时候只有你一人在推进,所以责任心和主人翁意识非常关键。
在科学相关领域工作多年后,我们认识到在任何时候可能只了解事情的10%-20%。我们现在讨论的所有内容都只是当前的理解,我们要像科学家一样,收集市场数据和证据,通过实验验证假设,据此调整行动计划。我们并不自称是AI for science的专家,而是积极的参与者,每天都在发现新的用户需求,这个过程非常有意思。
Quinn Leng:整体来看,首先,成员一定要自我驱动(self-motivation),这样才能真正把一件事负责到底;其次,在从事Deeptech或跨学科科学相关的工作中,好奇心(curiosity)非常重要,这是我们文化的第二点;第三是客户痴迷(customer obsessed),也就是愿意站在客户角度反复迭代,甚至直接进入他们的工作环境去理解和解决问题;最后是AI原生/使用新工具(AI native/adopt new tools),即主动拥抱并深度与AI协作,利用新型工具把事情做成。大致是这四点。
ZP:Quinn Leng曾分享过,生命科学是一个“technologically underserved”的行业,当你们和那些年入百亿美金的药厂交流时,发现他们在数据处理上最原始、最让您感到惊讶的做法是什么?
Ashton Teng:生命科学从根本上来讲,是一门探索自然(discover more things about nature)的科学。虽然物理和化学也都是自然科学,但生物可以说是在物理和化学之上的下一个抽象层。生物学的特点在于它非常“混乱”——它是地球上演化而来的结果,并非像计算机一样经过设计的产物,而是通过突变等随机方式形成的,因此整体非常复杂。
无论是人体、器官、组织、细胞还是蛋白质,都处于极度复杂的系统中。生命科学正是在这种复杂性中努力发现新规律的科学。这也是我一直对生物感兴趣的原因——正因为它的“混乱”。
早期的生命科学更多是靠试错来推动发现,比如青霉素就是偶然发现的。但随着“低垂果实”(low hanging fruits)被“摘完了”,但许多人类疾病仍远未解决,新的疾病也在不断出现。
而Tech Bio的概念则并非是试错,而试图更有系统性地发现某个新事物,近20年来行业也逐渐转向数据驱动。例如基因测序技术的突破终于让我们可以批量读取DNA数据。比如2000年时,人类全基因组测序为1亿美元的价格,随着技术的发展,全基因组测序价格已经降低至现在的500美元以下。除了DNA,我们现在还能测序RNA甚至单细胞RNA,CRISPR等基因编辑技术也让我们能够先改造细胞、后观测细胞变化。本质上,技术正在把生物学问题转化为数据问题。也因此,许多生物公司正在转变成“数据生成公司”。
但痛点也随之出现:一方面,我们仍有大量未知待探索,数据产生的速度和规模正在急剧增长;另一方面,行业的数据分析能力和软件工具仍远远落后于科技行业。这就导致数据处理和分析成为瓶颈。
生物信息学(Bioinformatics)就是这个背景下诞生的一个新领域,它结合生物学、计算机科学和统计学,企业内部也出现了一个专门负责分析这些数据的新角色。但在企业中,这类人才非常稀缺。一个小型生物科技公司有很多不同种类的科学家生产数据,但可能只有一位生物信息学家做数据分析。
因此产生了许多沟通成本——实验科学家必须与生物信息学家充分沟通实验设计,后者才能做出准确分析。更常见的是,实验完成后,科学家往往要等待数天甚至数周,才能拿到生物信息学分析结果。这大大拖慢了科学迭代的周期。这只是行业中数据相关痛点的其中之一,也是我们目前重点关注的问题。
ZP:生物信息学家的“复合型能力”要求高且稀缺。一个顶尖生物科技公司,为了完成一项核心的数据分析任务,在没有Kepler的情况下,通常需要付出多大的招聘成本和时间成本?
Quinn Leng:传统互联网公司也区分Data Scientist和Data Engineering两个岗位。最核心的区别可能在于科技行业中这些角色的定义更早、更明确,招聘也相对容易。科技行业中的服务形态、日志规范、数据采集方案等都已经比较成熟,招来的人只需掌握对应技能即可。但在生物领域,除了技术要求,还要懂生物本身,薪资会比科技行业顶级公司低一些,而要求反而更高,这就导致整个行业处于人才供给不足的状态。
Ashton Teng:我之前在行业内其实更多是工程师的角色,叫做 Bioinformatician Engineer。刚才提到的 Bioinformatician Scientist 主要负责写 Python 和 R 来分析数据、展示结果。而 Bioinformatician Engineer 这个岗位其实是因为数据量越来越大才出现的,本质上属于软件数据工程,但要求对生物数据的特性有所了解。
生物数据的形态和科技公司常见的数据非常不同,因此出现了许多专门的平台,比如数据语言转换平台。Engineer 的任务就是搭建公司内部的数据处理基础设施。我在三家 Tech Bio 公司负责的工作都是这方面的,因为它们的数据量极大,都需要建立专门的数据处理架构。
Engineer 负责搭建数据流水线(pipeline)、产出数据,通常还要做一些初步分析。等流水线足够成熟,Scientist 就可以自己进行分析。其中,Engineer 也必须理解实验数据的生成方式。不同种类的数据需要不同的算法。比如在 GRAIL,从 DNA 序列比对到去重处理,都是 Engineer 根据公司特定场景编写算法,再封装成流水线,供 Scientist 调用。最终的用户是 Scientist,他们会根据实验需求运行流水线,并进一步分析。
目前我们主要聚焦在Scientist端。因为数据处理流水线绝大多数情况下是确定性的,设立之后就应该稳定运行,虽然可以用AI写数据流水线,但运行数据流水线时肯定不需要AI每次都介入。而Scientist的工作往往是先在Jupyter Notebook(ZP注:一种流行的交互式编程工具)中加载数据,再根据问题和数据进行交互编码,上一步结果决定下一步操作,对推理能力要求很高。这类场景非常适合AI Agent发挥价值。
这两个岗位都挺难招的。我之前在不同公司帮忙招聘这两个岗位,常常很多个月都招不到合适的人。原因不在于没有人申请,而是不像科技公司的职位定义那么明确。比如在Google和微软做软件工程的要求可能是类似的,但生物科技公司会希望候选人对特定领域有了解,比如研究免疫系统的和研究传染病的候选人,需要选择更适合于公司研究领域的一个,这对Engineer和Scientist都同样重要。
另外,这类岗位同时要求生物、CS和统计背景,如果一个人这三项都很强,他可能去科技公司能赚更多,这也是个问题。薪资在硅谷其实和科技公司差距并不太大,属于一个类似的水平,但股票可能不如科技公司值钱。行业也比较新,有多年经验的人本身就不多。事实上,我在之前的公司招人时确实比较慢。
Quinn Leng:对,公司员工很大一部分收入来自股权激励。
ZP:数据量处理的这个角度,生物科技的这个公司和大厂比,会更大吗?
Ashton Teng:生物科技公司单条数据的大小肯定比科技大厂更大,但生物科技公司没有“十亿用户”这种概念,所以总量上不好直接对比。
Quinn Leng:可能无法与科技行业对比,因为数据类型完全不同。单从一次实验来看,生物领域的数据量通常大得多,比如一个样本可能就是多少GB的数据了,但是不可能从一个用户身上拿到几个GB的数据。
02重构科研流程:AI Agent如何解决生命科学的“最后一公里”
ZP:你们创立Kepler主要想要解决什么问题?
Ashton Teng:Kepler一开始的使用场景是生物数据分析,但它的定位并不限于此,它是一个AI Agent,能够灵活处理多种科学任务,尤其是与数据和信息相关的科研工作。准确来说,它是“Enterprise AI Agent For Life Science Research”。
具体来说,实验前,它可以帮助用户查询文献、产生实验想法;实验中,它可以连接数据流水线工具运行处理流程;实验后,它能够在了解实验目的的前提下结合实验元数据和生物数据进行分析,并将分析结果与其他人的发现及企业已有知识关联,辅助得出结论、生成报告,甚至提出下一步研究问题。因此,它不只是一个数据分析工具,而更像一个端到端的Scientist。
在没有AI Agent之前,除了数据处理流水线是自动运行的之外,其他环节基本都依赖人工。比如搜索信息,之前就是利用搜索引擎人工收集信息,并不会用到Python。包括查阅公司PPT等文件了解前人如何解决问题,这些都是人工完成的。此外,生物信息学家还需要与实验人员反复沟通实验流程和设计,只有中间实际分析数据那部分是用Python或R完成的。实际上,科学家每天可能只有一半时间在做实验,另一半时间都花在信息搜集和处理上。
我们希望除了实际动手做实验的环节之外,所有与数据、信息相关的科研工作,都希望能通过AI来辅助完成。不仅如此,我们还能做到他们目前做不到的事情——因为Kepler可以批量提问并和数据交互,所以可以获得上百个数据,快速进行多种探索。这不仅节省时间,更拓展了科学发现的可能性,是对现有科研方式的一种增强。
交付上来看,我们的AI Agent是设计给用户直接操作的。用户可以向Agent发出指令或提出研究课题,Agent会与人沟通、制定计划并执行研究。初期我们当然会帮助企业用户对接他们的数据库,因为Agent需要访问公司内部信息和数据源,但我们不直接替用户做具体的科学问题研究。
Quinn Leng:补充一点,我们正在解决的是业界最复杂的问题之一。目前真正能处理数百GB级多模态杂乱数据的智能体非常少见,这些数据源在规模、精确度和形态上都极其复杂,系统架构设计充满挑战。我们需要设计全新的交互方式让科学家能够高效使用,这些都是非常实际的技术难题。
ZP:从技术实现的角度,面临的核心挑战是什么?
Quinn Leng:挑战确实不少。首先是“对齐(Alignment)”与整合(Integration)问题——如何让AI真正理解领域内的需求?拿ChatGPT做对比,ChatGPT没有连接上对应专业工具,就算用MCP连接上,其效果也会差很多。生物领域的专业工具与传统工具也不一样,其数据类型非常多样(Multimodal),数据结构更复杂,使用工具的方式也往往需要结合专业反馈进行训练,才能让AI真正理解数据。
第二是“可验证性(Verifiability)”,即如何验证某个方向的结果。在科学领域,出结果的难度不会很大,因为可以通过试错得出。目前的AI产品常被吐槽胡说八道,背后缺乏的就是验证机制。因此产品从ChatGPT演变为Perplexity,再演变为Deep Research。在科学领域需要做得比Deep Research更深,不仅要去网上搜索文献,更可能要做实验并实际加载数据、运行分析。比如某种类型的基因数据与药物之间的实际反应效果是怎样的,能否把两个数据库加载出来,再去进行相应反应过程,最后在报告中注明的“7.5%”的效果是AI通过实际运行实验得出来的,而不仅仅是搜索网上信息。这对科学用户极为重要,因为他们最终需要的是可连接至事实的结论,而非连接到间接信息。
Ashton Teng:这类任务虽然也涉及编码,但比一般的AI编程更难验证。做AI编程可以直接提交PR,写个测试,人工可以直接测试这个功能是否真正完成,这类任务需要验证的长度与科学领域区别很大,这也是为什么AI编程先发展起来。但数据分析则没有那么容易验证,比如统计方法是否适用、分组定义是否合理等等,不是跑个测试就能判断的,专业性要求极高。此外,我们的用户可能是实验科学家而生物信息学家,因此我们需要设计清晰的交互界面,让Agent的决策过程清晰展现出来。
Quinn Leng:这不光在工程上很难,同时在人与Agent的交互方式上也算是非常新的方向,目前还没有公司做过“科学家与AI Agent交互”的产品。比如,引用(Citation)应该精确到什么程度?Deep Research可以精确到某个网页,但我们需要精确到某次实验,甚至是数据库中的某一行,整个流程该如何做?Agent在哪些环节可以自主推进,哪些需要向科学家确认?这些都是全新的交互流程,需要我们重新设计。
ZP:你们如何设计Kepler和用户交互的流程?
我们的做法是尽可能连接他们日常使用的所有软件和数据源——比如他们写过的Notebook、各类数据库(无论结构化和非结构化)、甚至一些很生僻的文件格式,以及上游实验记录平台(如Electronic Notebook)。其次,拥有这么多数据及工具后,如何管理并让Agent找到可用工具是另一个难点。我们则通过构建知识图谱(Knowledge Graph)来管理和导航这些信息,就像为新员工做入职引导一样,帮助Agent用更少的时间理解全部上下文。
03企业级AI的试金石:Kepler的首个企业客户与市场验证
ZP:你们在成立第一周就找到了首个企业客户,可以分享一下这个故事吗?
Ashton Teng:我们是5月初成立的,确实第一周就找到了第一个企业客户,这其实是通过熟人介绍的——生物科技这个圈子非常看重关系,很多公司都在硅谷。之前我在行业其他公司的前同事举办了一个私人聚会,认识了Tahoe Therapeutics的CSO,和他聊到我们在做的事情,他表示这正是他们需要的。
后来我们了解到,他们内部其实早就规划和设计过,想要一个能用自然语言与数据交互的界面,但由于公司重心不在软件开发,自己实现困难太大;也考虑过找外包,但效果不理想。正好在这个时间点我们出现了,他们有数据,而我们有专业产品能力,于是他们成了我们的设计伙伴(design partner),也是第一个客户,和我们一起迭代了最早的产品形态,我们也非常感谢他们。他们虽然是一家初创公司,但在AI+Bio领域很有影响力,前几天刚融了3000万美元,打算做生物学的基础模型(Foundation Model)。后来我们也陆续发现了很多公司都有类似需求,而第一个客户确实有些机缘巧合。
ZP:Kepler最典型的目标客户画像是什么样的?
Ashton Teng:客户群体其实可以分为不同的细分领域,任何新技术都会存在早期采用者和晚期采用者,生物科技公司也是如此。虽然痛点相似,但有些公司相对保守,我们产品发布后,主动联系我们的主要是创新型公司,比如内部已经在进行AI尝试的企业,特别是那些专注于生物基础模型研究的公司。虽然不能完全算AI原生企业,但由于地处硅谷,他们更愿意尝试新的AI软件和产品,这些公司通常数据量较大,痛点也更加明显。
这是我们关注的第一个客户细分,同时我们也与许多高校实验室合作,虽然实验室的付费意愿可能不高,但他们的痛点同样显著,很多生物学家进入实验室后还需要从头学习编程来分析数据。不同于企业有专门的生物信息学团队,实验室通常只有实验人员,但他们同样需要进行数据分析,因此我们也致力于支持学术科研,与众多实验室保持着合作关系。
ZP:顶级大型药企组织架构完善且人员配备齐全,这类客户会是我们目标吗?他们更愿意自建团队解决问题,还是采用AI工具?
Ashton Teng:实际上我们正在与一家全球前二十的大型药厂合作,他们内部确实拥有规模庞大的AI团队,也尝试过开发类似ChatGPT的工具,并进行AI数据分析的探索。虽然我不完全了解内部情况,但这家药厂是在看到我们公司成立的消息后,主动通过网站上的投资人信息联系到我们。
药企行业竞争激烈,现在能否快速实现AI转型已经成为重要的考核指标。尽管他们可以招募大量人才,但由于不是软件或AI原生企业,其文化氛围并非以AI为核心。因此内部开发工具的速度和通用性都存在局限,仅为内部使用的工具,很难像我们这样为众多公司提供服务的产品那样可靠和通用。基于这些因素,药企也开始意识到有些解决方案更适合采购而非自建。当然,每家药厂在“自建与采购”之间的权衡都不尽相同,这取决于其内部的战略重点,但可以肯定的是,现在很多药企都在积极寻找这类解决方案。
他们确实可以开发一些单一功能的应用,比如类似早期ChatGPT这样的工具。但当涉及到大规模数据分析时,技术难度就大幅提升。
Quinn Leng:之前在行业里多次观察到这种情况。通常药企与顶尖AI公司之间至少存在两层隔阂:首先,他们的软件团队专业水平有限;其次,即便是软件团队,对AI的理解也不够深入。经常出现的情况是当新技术出现时,他们参加几个讲座就认为能够自主开发,但往往几个月后就跟不上技术发展,最终还是要采购外部解决方案。比如在ChatGPT出现后,很多企业最初都想自建类似系统,但随着技术复杂度提升,最终还是选择购买服务,文献管理、实验平台等工具都经历了这样的过程。
我们正是抓住了这个机遇,对于需要高度复用、技术难度大的场景,比如我们要开发的agent系统,它需要代替人类进行实验操作,访问大量数据,编写代码,并整合多种数据源,如果控制不当,可能会带来严重的安全隐患。做得好是得力助手,做得不好就可能成为内部黑客,如何确保agent的安全性和合规性,是整个行业都面临的重要挑战。
ZP:我们目前似乎还没有直接竞争对手,你认为未来竞争对手可能会是谁?
Ashton Teng:这个领域确实已经出现一些初创公司,而且未来还会有更多竞争者,但对我们来说,最关键的是执行能力。我们在企业级软件方面的背景和经验,让我们能够更快地推进项目,此外,我们的业务范围也与他们不完全相同。实际上,我最关注的反而是像Palantir这样的公司,他们采取的是“前向部署”模式,会直接派驻工程师到企业内部进行部署。
目前我们不太担心OpenAI或Anthropic这类通用AI公司,因为他们的定位是开发通用工具,而我们会针对生物领域的特定需求来优化模型功能。这些通用技术提供商存在“最后一公里”的问题,他们不会深入企业去整合具体工作流程。而Palantir已经成功进入两家药企,虽然目前可能更侧重于生产制造或数据管理等领域,他们确实具备派驻工程师为客户定制解决方案的能力。在不同类型的竞争对手中,Palantir确实最值得关注,不过他们的商业模式决定了扩张速度不会太快,这家公司存在多年才进入两个药厂客户,而且他们的业务范围与我们也不完全相同。
ZP:在商务拓展过程中,客户选择软件提供商时最看重哪些能力?他们的核心考量标准是什么?
Ashton Teng:客户首先看重的是声誉和权威性,这也是为什么我们从一开始就定位为企业级解决方案,作为初创公司需要先赢得客户的信任。这个行业很大程度上基于关系网络,并非单纯选择技术最好的产品,有时合作关系或行业资历更重要。历史上,大药厂倾向于选择经验丰富的软件公司合作,而生物科技公司则相对灵活。但就AI领域而言,传统软件提供商的创新速度跟不上发展,也缺乏优秀的AI产品。这创造了一个难得的机遇窗口:大药厂开始愿意与早期AI初创公司合作,这在过去是很少见的。以往都是先从小的生物科技公司做起,逐步发展壮大后再进入大药厂,但现在很多大药厂都愿意评估新兴的AI初创公司。
ZP:我们目前专注于生命科学垂直领域,未来的拓展方向是怎样的?
Ashton Teng:我们的长期愿景是成为每个研究组织的“中枢神经系统”。虽然目前专注于生物领域,特别是研究任务相关的AI Agents,但我们的技术可以拓展到其他科学领域,比如材料科学、气候科学、农业等,这些领域都有类似的研发需求。我们的核心观点是:虽然存在通用的企业级AI Agents,专注于IT自动化、人力资源自动化等领域,但研究型组织的目标和日常任务与产品型公司有本质区别。因此,专注于研究任务的企业级AI Agents是一个独特的定位,可以扩展到其他科学领域。
ZP:现在有些初创公司专注于实验环节,通过软件或硬件方案介入实验过程,而我们主要解决实验之外的数据相关事务。你认为未来这两类公司会是什么关系?实验操作和数据分析的界限会越来越模糊吗?未来会呈现怎样的发展态势?
Ashton Teng:这两类公司实际上具有很好的互补性,—家侧重知识与智能,另一家侧重自动化。它们可以通过API等方式进行深度结合。当然,也存在一些获得大量融资的公司选择全栈式发展,自建实验室形成“Lab-in-the-Loop”闭环,专门研发自己的药物而非销售软件。AI for science领域会呈现多种形态,但不可能所有公司都采用全栈模式或从头自建所有系统。大多数公司仍然需要采购AI相关工具,这就好比AI编程工具,一旦有公司采用,其科研效率就会获得提升,这种优势自然会推动技术的普及。
ZP:从创业节奏来看,接下来一年最重要的三件事是什么?
Ashton Teng:确实有很多人都在关注这个问题,无论是广义的AI科学家还是其他团队,这不仅关乎效率提升,本身也极具吸引力,比起AI在保险等传统领域的应用,更能吸引人才加入。AI for science领域的人才密度正在快速提升,这让我们对未来充满信心。虽然竞争激烈,但我认为不会有某家公司垄断整个市场,科学研究领域非常广阔,不像销售自动化等应用存在明显天花板。科学探索具有无限可能性,AI在这个领域的发展也没有上限,完全可以容纳多家公司共同发展。
接下来一年最重要的三件事是:首先,确立我们在生命科学研究领域企业级AI Agents的领导地位,通过招聘合适人才、与核心客户共同迭代产品,建立权威性;其次,深度整合客户工作流程,不仅要提供数据分析服务,更要成为他们的“系统记录”平台,存储和分享数据,增加用户粘性;第三,持续完善产品功能,提升平台价值,确保客户一旦使用就不易更换。
接下来,我们最想吸引优秀的人才加入,我们的价值主张是:首先,我们是AI原生的公司,所有可能有用的新技术都可以尝试;其次,我们不仅关注AI,也重视流程优化,公司本身就像一个有机体,需要快速迭代进化。我们希望能吸引对科学工作充满好奇心、渴望探索发现的人才,加入我们这个快速发展的AI数据初创公司。
04快问快答
ZP:接下来,让我们通过几个轻松的问题,走近生活中的Ashton与Quinn,第一个问题,可以分享一下你们的星座或MBTI人格类型吗?
Ashton Teng:狮子座,INTJ。
Quinn Leng:我是双子座,INFJ。
ZP:那你们平时有什么兴趣爱好吗?
Quinn Leng:我特别喜欢烹饪,尤其是做各种复杂的料理。最近还迷上了滑板,开始滑板通勤,其他爱好包括滑雪和潜水。
Ashton Teng:Quinn的厨艺确实是一绝!创业前两周我天天去他家,他总能做出特别精致的美食。他这是“压力烹饪”,而我是“压力进食”,压力大的时候就会吃很多。吃饭算是我最大的爱好了,为了能吃更多,我也保持运动习惯,比如健身。我们都喜欢滑雪和潜水,以前喜欢读书,现在时间有限,改成用Audible听书比较多了。
ZP:我们还投资了一个更AI原生的听书产品,不过还在探索阶段。
Ashton Teng:我一直在寻找能实现“即时阅读”理想状态的产品,根据你的提问或兴趣动态生成内容,逐步构建你的知识图谱,了解你的认知边界。比如每天早晨利用碎片时间,推送恰好能拓展你认知边界的内容。这需要精准把握难度:太简单没有收获,太复杂又会放弃。很多书籍要么重复已知内容,要么过于艰深,将内容个性化适配到每个人的认知水平,这个方向让我很感兴趣。非虚构内容可以通过快进或者回放等行为获取信号。但听书确实存在不同使用场景,有时不是为了获取新知,而是为了放松。
ZP:创业者容易为自律人群做产品,过度追求效率和个人数据追踪,但这只是小众需求。
Quinn Leng:这确实容易导致过度拟合(overfit)。
ZP:过往人生经历中,对你们影响最大的一本书或一个人?
Quinn Leng:我思考了一下,虽然《人类简史》从信息视角解读人类发展让我受益匪浅,但对我影响最大的其实是吴军老师的《浪潮之巅》。这本书讲述了硅谷的发展历史,正好回应了我大学时期最关注的两个问题:如何做出最顶尖的技术,以及如何让技术真正触达用户。比如IBM最早做出计算机,但真正让电脑普及的是Windows这样的公司;苹果虽然没有发明鼠标或触屏,却是第一个将这些技术带给大众的企业。这本书让我深刻理解了技术商业化的重要性,以及科技公司兴衰更迭的规律。
Ashton Teng:我平时更多通过科技类播客获取实时信息,读书方面也很喜欢《人类简史》。但对我影响最深的是《枪炮、病菌与钢铁》,虽然它的地理决定论视角有一定局限性,但开启了我对社会系统的思考。后来我又读了《国家为什么会失败》等书,从制度角度理解国家发展差异。总的来说,我对人类社会组织和系统形态的形成特别感兴趣。正是因为有了各种社会制度和组织形态,我们才能在这个抽象层上进行科学探索和创业创新,而不是整天为温饱担忧,这种人类文明的演进让我觉得非常神奇。
ZP:你们平时最常用或最喜欢的AI产品是什么?
Quinn Leng:我们最常用的是Devin和Claude Code。虽然谈不上最喜欢,但在AI编程工具中确实用得最多。
说实话,目前还没有遇到真正令人信服的AI产品。Devin在AI原生方面做得还算可以,但远谈不上完美,预计未来一两年会出现更成熟的产品。
Ashton Teng:我对AI产品没有情感连接,从不和AI聊天,纯粹作为工具使用。所以我们做的产品也不提供情绪价值。
ZP:为什么选择Devin而不是Cursor等其他工具?
Quinn Leng:Cursor更像是Copilot(辅助编程),而Devin更接近Autonomous(自主编程)。我们花了大量时间设计公司架构,使新员工入职体验与接入新agent一致,agent需要了解公司所有事务,参与开发、设计甚至测试流程,Devin在这方面做得最好。
Ashton Teng:Cursor无法理解公司整体背景内容,每次都需要重新解释背景信息。而Devin已经理解代码库的各种关联,可以自主完成任务。我们在产品设计中也借鉴了Devin的模式,因为Copilot形态只能给生物信息学专家使用,无法解决其他科学家分析数据的问题。
ZP:你描述的Devin解决的问题,承载历史数据和工作背景信息,在文字处理和研究领域还没有做得好的产品。
Ashton Teng:创业后这方面需求很大,虽然编程效率提升很多,但公司运营方面缺乏加速工具。比如应该有个产品能基于公司整体情况帮我写推文,或者根据不同对象(投资人、客户、员工)生成相应的描述文案。现在每次都需要重新构思和提示。
Ashton Teng:工作场景和个人生活肯定需要分开,很难有一个AI同时胜任工作助理和个人助理,因为工作涉及复杂的人际关系。理想状态是有独立的work assistant(工作助理)和personal assistant(个人助理),各自拥有完整的背景信息。
ZP:我实际使用最高频的还是Gemini,AI发展太快了,半年前AI整理会议纪要还不可用,现在Gemini已经能达到人类水平的80-90%。
Ashton Teng:这也是初创公司的困境,大平台作为system of record(系统记录)具有天然优势,比如即使Notion功能更好,但为了与其他使用Google Workspace的公司协作,我们最终还是用Google Docs。在企业领域,数据分析分享还没有确立统一标准,这反而创造了一些机会。
ZP:你们在海外应该经常听播客,能否推荐一些信息密度较高的节目?
Ashton Teng:我喜欢《Acquired》,这是一个深度商业历史类播客,每月只更新一集,但内容非常详实。
现在VC行业也很卷,需要建立个人品牌。比如Jack Altman刚开了个播客《Uncapped with Jack Altman》。初创公司有PR和分发需求,作为VC如果能给投资组合带来正确的曝光,这是非常有价值的事。
Quinn Leng:我推荐《No Priors》,是Sarah Guo主持的节目。她不仅做投资,更注重深度思考,经常邀请客户和创业者分享见解,内容质量很高。她对各种话题的理解层次都很丰富,而且充满热情。现在这个平台已经成为一个重要渠道,很多公司在发布新产品前都会找他交流。
Y Combinator也在这方面做得很好,他们的YouTube内容很完善,既有教育类内容,也有访谈节目,现在每期都能达到几百万的播放量。
请注意,此次访谈内容已经过精心编辑,并得到了Ashton Teng和Quinn Leng的认可。欲了解更多关于Kepler AI的信息,敬请访问其官方网站https://www.getkepler.ai。我们也欢迎读者通过留言互动,分享您对本访谈或Kepler AI的看法。
Z Potentials 将继续提供更多关于人工智能、全球化市场、机器人技术等领域的创业者访谈。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。
-----------END-----------🚀 我们正在招募新一期的实习生🚀 我们正在寻找有创造力的00后创业关于Z Potentials