a6d582bc8490499626e2202e6351723b
Subtitle language:
00:00 → 00:04
Erzählen Sie uns von der Multimodalität bei der Stiftung, warum sie so wichtig ist,
00:04 → 00:10
Und was ist der größte Durchbruch und die charakteristischen Unterschiede als Ergebnis?
00:10 → 00:16
Es gibt also zwei Dimensionen der Multimodalität, zwei Gründe, warum sie interessant ist.
00:16 → 00:22
Der erste Grund ist etwas bescheiden.
00:22 → 00:26
Der erste Grund ist, dass Multimodalität nützlich ist.
00:27 → 00:30
Es ist nützlich für ein neuronales Netzwerk zu sehen.
00:30 → 00:35
Insbesondere die Vision, denn die Welt ist sehr visuell,
00:35 → 00:38
Menschen sind sehr visuelle Tiere.
00:38 → 00:45
Ich glaube, dass ein Drittel des menschlichen Cortex dem Sehen gewidmet ist.
00:45 → 00:53
Und so, ohne Vision, ist der Nutzen unserer neuronalen Netzwerke,
00:53 → 00:58
Die Kommission hat sich mit der Frage der
00:58 → 01:01
Es ist also ein sehr einfaches Argument der Nützlichkeit.
01:01 → 01:06
Es ist einfach nützlich zu sehen.
01:06 → 01:10
Und GPT-4 kann ziemlich gut sehen.
01:10 → 01:13
Es gibt einen zweiten Grund, Visionen zu machen.
01:13 → 01:19
Wir lernen mehr über die Welt, indem wir aus Bildern lernen.
01:19 → 01:21
Zusätzlich zum Lernen aus Text.
Multimodality is important for two reasons: 1) It's useful, as vision enhances the practicality and value of neural networks. 2) It allows us to learn more about the world through images, in addition to text.
This video in English was translated to Deutsch, English, Español, Français, עברית, हिन्दी on March 22, 2023, using Targum.video AI translation service.