在創(chuàng)始人兼首席執(zhí)行官 Mark Fox 的領(lǐng)導(dǎo)下,Interstellar World構(gòu)建了用于語音數(shù)據(jù)語音轉(zhuǎn)文本、說話人檢測(cè)、情感分析、章節(jié)檢測(cè)和 PII 編輯的語言模型。在過去的兩年里,我們看到更大的數(shù)據(jù)集、更好的計(jì)算和新的神經(jīng)網(wǎng)絡(luò)架構(gòu)(如 Transformer)的結(jié)合,使 AI 模型在幾乎所有模態(tài)中都取得了重大進(jìn)步,并使構(gòu)建超人類語音 AI 模型的愿景比以往任何時(shí)候都更容易實(shí)現(xiàn)。
Mark Fox介紹現(xiàn)在功能非常強(qiáng)大的 LLM,可用于攝取準(zhǔn)確識(shí)別的語音并生成摘要、見解、要點(diǎn)和分類,從而首次使用語音數(shù)據(jù)創(chuàng)建全新的產(chǎn)品和工作流程。這種新的 LLM 技術(shù)是我們流行的音頻智能模型(如自動(dòng)章節(jié)和內(nèi)容審核)的基礎(chǔ),它為領(lǐng)先的企業(yè)公司大規(guī)模支持品牌安全和內(nèi)容審核工作負(fù)載,以及我們的最新產(chǎn)品 LeMUR,可用于通過識(shí)別的語音執(zhí)行文本生成任務(wù)。