Google DeepMind AI語言模型正在嘗試為YouTube短片添加描述 | 速途網
速途網5月25日訊(報道:喬志斌)當地時間周三,谷歌宣布將DeepMind和Google Brain合并為一個大型AI團隊,新的Google DeepMind分享了如何使用其視覺語言模型(VLM)為YouTube Shorts生成描述的細節,這有助于提高可發現性。

“短片是在短短幾分鐘內創建的,通常不包括描述和有用的標題,這使得它們更難通過搜索找到,”DeepMind在帖子中寫道。火烈鳥可以通過分析視頻的初始幀來解釋正在發生的事情來進行這些描述。(DeepMind舉了一個例子,“一只狗在頭上平衡一堆餅干。文本描述將存儲為元數據,以“更好地對視頻進行分類并將搜索結果與觀看者查詢相匹配”。
谷歌DeepMind的首席商務官科林·默多克(Colin Murdoch)表示:對于Shorts,創作者有時不會添加元數據,因為創建視頻的過程比長視頻更簡化。Shorts產品管理總監托德·謝爾曼(Todd Sherman)補充說,由于Shorts主要是在Feed上觀看的,人們只是滑動到下一個視頻而不是主動瀏覽它們,因此沒有那么多的動力來添加元數據。