Google´s Gemini ist da

Google hat kürzlich Gemini, ein neues KI-Modell, vorgestellt, das in den meisten Tests besser als ChatGPT abschneidet und fortschrittliche Denkfähigkeiten in verschiedenen Formaten aufweist, einschließlich der Fähigkeit, Schülerarbeiten im Fach Physik zu bewerten. Gemini, das nach einem globalen Gipfel zur KI-Sicherheit angekündigt wurde, übertrifft in 30 von 32 Benchmark-Tests einschließlich in den Bereichen Logik und Bildverständnis die fortschrittlichsten KI-Modelle, darunter auch GPT-4. Das Modell verfügt über drei Versionen und ist multimodal, was bedeutet, dass es Text, Audio, Bilder, Videos und Computercode gleichzeitig verstehen kann. Es wird zunächst in über 170 Ländern, einschließlich der USA, als Upgrade zu Googles Chatbot Bard eingeführt, allerdings nicht im Vereinigten Königreich und in Europa.

Die leistungsstärkste Version, Ultra, wird derzeit extern getestet und soll Anfang 2024 veröffentlicht werden. Sie wird auch in eine Version von Bard namens Bard Advanced integriert. Ultra war das erste KI-Modell, das in einem Multitasking-Test namens MMLU, der 57 Fächer umfasst, besser als menschliche Experten abschnitt, und wird nun ein neues Code-Schreibtool namens AlphaCode2 antreiben. Die Ultra-Version wird einem externen "Red Team"-Test unterzogen und Google wird die Ergebnisse mit der US-Regierung teilen.

Es gibt Bedenken, dass sogenannte "Halluzinationen" oder falsche Antworten bei dem Modell weiterhin ein Problem darstellen. Obwohl alle Versionen von Gemini multimodal sind, können die jetzt veröffentlichten Pro- und Nano-Versionen derzeit nur in Text- oder Codeformat antworten. Promotionsvideos von Gemini zeigten unter anderem die Fähigkeit der Ultra-Version, handgeschriebene Physik-Hausaufgaben eines Schülers zu verstehen und detaillierte Tipps zur Lösung der Aufgaben zu geben. Es gibt jedoch weiterhin Bedenken bezüglich der KI, einschließlich der Entwicklung künstlicher allgemeiner Intelligenz (AGI), die auf einem Niveau menschlicher oder übermenschlicher Intelligenz agieren könnte. Hassabis von Google betonte, dass multimodale Grundlagenmodelle wie Gemini möglicherweise Schlüsselkomponenten für AGI sind, aber es gibt immer noch fehlende Elemente, die erforscht und innoviert werden müssen.

Zurück
Zurück

GPT-4´s Initial Prompt

Weiter
Weiter

Q* als Grund für das Drama?