文|鄧詠儀
編輯|蘇建勛
2025 年 9 月,VideoTutor 創(chuàng)始人趙凱與幣安創(chuàng)始人趙長鵬第一次在線上見面,進行了一次深聊。一個月后,他的第一筆融資順利完成——趙長鵬 YZi Labs 宣布領(lǐng)投 VideoTutor,成為這家初創(chuàng)的第一輪外部投資人。
趙凱表示,之所以能夠迅速敲定融資,首要原因在于,雙方對于教育的巨大熱忱是一致的——趙長鵬也曾在功成名就之后,推出非盈利教育項目 GiggleAcademy,為發(fā)展中國家的貧困兒童提供教育機會。
第二則是,VideoTutor 團隊展現(xiàn)出的快速迭代能力。投資完成后,趙長鵬對這位年輕人的唯一建議是:" 堅持把產(chǎn)品做好,不要那么著急賺錢。"
這筆融資之后,一切都在加速。不久后,趙凱做出了一個更艱難的決定——正式辦下輟學手續(xù),開始全職創(chuàng)業(yè)。
如果讓趙凱講述自己的經(jīng)歷,就像一部劇情進展飛快的創(chuàng)業(yè)小說。
小學三年級時,他第一次讀到《硅谷之火》和凱文凱利的書,讓他第一次對大洋彼岸的科技世界有了初印象,并且開始不斷折騰——自學編程,積極參加各類競賽,拿獎,為來到硅谷做準備。
2023 年,趙凱考入美國圣何塞州立大學,迅速開始了創(chuàng)業(yè)歷程:大一時和學長一起研發(fā)大學生戀愛 App,拿到 20 萬美金融資,八個月后項目失敗;大二時,參與創(chuàng)辦數(shù)學學習應(yīng)用 MathGPT Pro,入選奇績創(chuàng)壇,拿到早期投資。
但第二段創(chuàng)業(yè)讓他覺得,純文字類的拍照搜題 App,已經(jīng)觸碰到天花板。于是,在 2025 年,他和谷歌 AI 工程師 James、室友 Nick 正式成立了新公司 VideoTutor,依舊圍繞解題場景創(chuàng)業(yè)。
VideoTutor 是一個 AI 解題應(yīng)用——學生可以通過拍照或文字輸入一道數(shù)學題(目前以 SAT、AP 等標準化考試題目為主),數(shù)十秒后,就能生成一段帶有流暢的解題動畫(如畫函數(shù)圖像、標注幾何圖形)、以及清晰的步驟拆解,體驗非常接近一位優(yōu)秀老師在白板上為你講題。
目前,VideoTutor 還在前期測試階段,首次生成解題視頻免費,此后每生成 4 條視頻收費 3.99 美元。

△來源:VideoTutor
這個應(yīng)用達到的成就是:產(chǎn)品上線 20 天,注冊用戶已超 3 萬人,視頻播放量破千萬,生成了超 10 萬條視頻。
近期,VideoTutor 還完成了一輪超過 1100 萬美元的新融資。本輪融資由趙長鵬旗下的 YZi Labs 領(lǐng)投,BV 百度風投、錦秋基金、Amino Capital、BridgeOne Capital 以及多位知名投資人聯(lián)合參投。這也是近期北美學生創(chuàng)業(yè)中,融資金額頗高的天使輪融資。
趙凱說,之所以一直在教育和學生賽道里打轉(zhuǎn),除了因為創(chuàng)始團隊都是學生,能更好理解學生群體的需求。
更深層次的原因在于,他自己也是通過接受高等教育,才有了今天的成績:在國內(nèi)上完高中,受到外國夫婦的資助,父母甚至賣房供他上學,最后才能來到美國硅谷求學,追逐創(chuàng)業(yè)夢想。
在完成這輪融資之前,VideoTutor 還拒絕過一次高額的收購要約。
趙凱對《智能涌現(xiàn)》說,拒絕收購,是因為他認為如今的解題只是 VideoTutor 的起點——以后 VideoTutor 能夠走得更遠,能夠拓展到更多科目、學習環(huán)節(jié),成為一個多學科的產(chǎn)品,超越多鄰國等頭部教育應(yīng)用。
從生成解題視頻開始,瞄準備考人群
在解題場景,精準性很重要。VideoTutor 的產(chǎn)品難點在于,如何讓 AI 生成的視頻做到精準?
趙凱解釋說,首先是幾何解析的難點。傳統(tǒng)的 OCR 識別技術(shù)很難做到精準,VideoTutor 在產(chǎn)品中,內(nèi)置了一個幾何解析器,能夠把三角形、平面幾何、線形等圖形轉(zhuǎn)化成大模型能夠理解的機器語言,準確描述點、線、面之間的幾何關(guān)系。
其次是動畫渲染,以往的很多軟件產(chǎn)品,在渲染動畫時會出現(xiàn)元素錯位問題,比如曲線沒有出現(xiàn)在正確的坐標軸上。
針對這個問題,VideoTutor 團隊從底層開始重寫了一套動畫引擎渲染協(xié)議,能夠把不同的元素精確放在不同位置,通過代碼,可控地讓引擎去渲染每一幀畫面。
答案的準確性也是痛點之一。因為大模型有幻覺,很難保證答案 100% 準確。VideoTutor 采用兩層模型去對比答案——如果題目比較難,會通過 Claude 和 Gemini 兩個模型校正,答案一致才輸出,保證準確性。
最后是大量的真實樣本訓(xùn)練。VideoTutor 已經(jīng)生成了超過 10 萬條視頻,并且組建了一個由 SAT 和 AP 的高分學生組成的團隊。這些學生會負責標注 AI 生成視頻哪部分講解錯了,正常學生學習時會怎么講,這些真實反饋被用來重新訓(xùn)練模型。
" 我們現(xiàn)在已經(jīng)微調(diào)了數(shù)千個 SAT 和 AP 的樣本視頻。" 趙凱說," 隨著數(shù)據(jù)越來越多,生成視頻的成本也在不斷降低,并且會形成飛輪效應(yīng)。"
這和以前的學習模式形成了鮮明對比。以往,老師需要用幾何畫板、PPT 或其他可視化工具繪制圖形,錄屏講解。準備一個小時的視頻課程,至少需要后期一到兩個小時的制作時間。而且這些視頻是靜態(tài)的、標準化的,無法做到千人千面。
這個環(huán)節(jié)甚至已經(jīng)在北美催生出了著名 IP,在 YouTube 上的 3blue1brown 頻道,由斯坦福數(shù)學系的校友 Grant Sanderson 創(chuàng)立,同樣以制作可視化的數(shù)學解題視頻為主,已經(jīng)吸引了近 800 萬人訂閱。
而現(xiàn)在,在 VideoTutor 的產(chǎn)品上,從學生輸入問題到生成完整視頻,只需要 60-90 秒。
VideoTutor 的產(chǎn)品在上線后,也引發(fā)了不少關(guān)注。趙凱表示,團隊在推特上發(fā)布了一個對比視頻,把可汗學院真人老師錄制的視頻和 AI 生成視頻放在一起,大家發(fā)現(xiàn)好像兩者沒什么區(qū)別。產(chǎn)品上線后,VideoTutor 的 20 天注冊用戶已超 3 萬人,視頻播放量破千萬,生成超 10 萬條視頻。
" 勢能為王 "
不可否認,VideoTutor 有一些好運氣。
在訪談中,趙凱反提到了多次一句硅谷名言:"Momentum is King"(勢能為王),意為初創(chuàng)在發(fā)展早期需要保持持續(xù)的增長勢頭,無論是產(chǎn)品迭代、用戶留存、還是人才、資金吸納速度,要保持加速的積極勢頭。
如今,VideoTutor 的團隊不到 10 人,團隊一起租下了硅谷 Sunnyvale 的一座獨棟別墅,離學校足夠近,能夠隨時走訪學生和老師,團隊成員以天為單位迭代功能。" 只有保持小團隊規(guī)模、減少溝通成本,才能保證產(chǎn)品快速迭代。" 趙凱說。

△ VideoTutor 團隊
2025 年,基礎(chǔ)模型仍在快速發(fā)展之中,技術(shù)邊界難以預(yù)料。創(chuàng)業(yè)時機無疑是重要的——在 Claude 4.0 以及 GPT-5 等模型發(fā)布后,基模的推理能力大大增強,這為 VideoTutor 的起步提供了非常好的基礎(chǔ)。
在 VideoTutor 之前,硅谷也曾出現(xiàn)過模式類似的創(chuàng)業(yè)公司。2024 年 4 月,由斯坦福大學一個學生團隊研發(fā)的同類產(chǎn)品 Gatekeep,同樣專注在 AI 解題視頻生成,曾拿到融資,引起轟動,但很快就暫停更新。
Gatekeep 難以為繼的核心原因,趙凱認為有兩點:第一,Gatekeep 創(chuàng)業(yè)時,當時基座模型的 Coding 能力不夠成熟,Claude 4.0 還沒發(fā)布,Sora 也沒發(fā)布;第二,產(chǎn)品的動畫引擎還暫時無法做到點、線、面的精準渲染。
不過,基模的發(fā)展也是雙刃劍。比如,在 VideoTutor 成立公司沒多久之后,ChatGPT 就推出了 Study 模式。
我問趙凱,會害怕被基礎(chǔ)模型吞沒嗎?
" 想明白自己的價值很重要。" 趙凱回答," 大模型廠商的核心使命是 AGI,它們不太可能在所有細分領(lǐng)域都投入重兵,這為真正懂行業(yè)的應(yīng)用層公司留下了生態(tài)位。我們的價值在于,比大廠更懂教育,更懂學生。"
對于賽道上的其他競爭對手,趙凱表示,VideoTutor 和他們瞄準的場景并不完全相同。比如 Chegg、Gauthmath 對應(yīng)的是日常作業(yè)輔導(dǎo),學生使用動機更多是完成作業(yè),需要快速得到答案。
" 兩者的根本區(qū)別在于學習動機," 趙凱解釋道," 我們的用戶目標非常明確——為了通過 SAT 或 AP 考試,他們有主動學懂、學會的強烈需求。而許多作業(yè)解答 App 更像是被動學習工具,如果只是快速得到答案完成任務(wù),這種需求很容易被免費的通用大模型滿足。"
從商業(yè)模式來看,VideoTutor 目前希望讓 AI 可以逐步替代部分線下的家教環(huán)節(jié)。如今,在美國請線下家教的價格至少是每小時 100-400 美金,線上網(wǎng)課也要約 100 美金一節(jié)課。從價格來看,VideoTutor 如今生成四條視頻僅收費 3.99 美元,價格已經(jīng)降低數(shù)十倍。
VideoTutor 希望能夠先從備考人群出發(fā),然后拓展到更多領(lǐng)域和科目。"K12 領(lǐng)域的所有學科問題,理論上都可以生成講解視頻,因為 K12 有相對標準化的教材和知識點。" 趙凱說," 未來,我們會從 SAT、AP 數(shù)學拓展到更多學科,從解題環(huán)節(jié)延伸到學習路徑規(guī)劃、效果評估,最終成為每個學生的專屬 AI 導(dǎo)師。"
VideoTutor 未來計劃 C 端和 B 端市場同時發(fā)力。
目前,團隊已經(jīng)獲得了第一批 B 端合作的意向訂單。比如,一家擁有 6 萬名學生的印度教培機構(gòu)已經(jīng)簽署了合作協(xié)議,通過用 VideoTutor 讓學校學習 JEE Advanced(印度理工入學考試)。就在 10 月,VideoTutor 剛剛又與美國校園社交平臺 Fizz 達成合作,后者在美國有超過 350 所大學的用戶覆蓋。
趙凱用了十年的社交媒體頭像是他最喜歡的角色——超能陸戰(zhàn)隊的主角 Hiro,一位天才極客少年,用自己的科技才能去幫助他人、改變世界。
" 美國有很多孩子請不起每小時 400 美金的家教,但他們同樣需要好的教育。" 趙凱說,在未來,VideoTutor 最大的目標是能達到教育平權(quán),讓更多孩子擁有好的教育資源。