[blog] Freitag ist Ki-Tag :)

Tiroler

Zitat von SkyBird1980

Was allerdings bei der Einstellung das dies eine Erniedrigung ist - und nichts anderes sagst Du damit aus - natürlich nicht hinnehmbar ist.

Unterstell mir bitte nicht immer solche Sachen die ich so nie gesagt habe!

Und lasse dir gesagt sein, meine Expertise hätte in einem Handwerksbetrieb nur sehr eingeschränkt einen Nutzen. Sprich ich könnte das was ich gelernt habe und über mittlerweile mehrere Jahrzehnte erfolgreich praktiziert habe schlichtweg vergessen. Das wäre für mich ein Rückschritt ohne damit das Handwerk an sich abwerten zu wollen. Das hat auch überhaupt nichts mit Erniedrigung zu tun. Genausowenig wie mein Beruf mit Handwerk zu tun hat, mal davon abgesehen dass ein Handwerker Kunde bei mir sein kann.

Aber sicher findest du jetzt wieder etwas, was du mir vorwerfen kannst. Glaube du nur weiter an die schöne neue Welt. Was mich betrifft habe ich keinen Bock mehr darauf dass das jetzt so ausartet und mir solche Sachen unterstellt werden. Ein fairer Meinungsaustausch sieht anders aus!

don

Mit einem "Ki-Tag" pro Woche komme ich bald schon nicht mehr aus.
Was alleine in den letzten 7 Tagen passiert ist.

Und eine Bitte:
Nehmt euch einen Stift und Zettel und macht je einen Strich für "das ist Gut für uns" und einen für "das ist schlecht für uns", wenn ihr einen Teil gelesen habt. Gamification!
[cbox][/cbox]

Eine Geschichte von Gut und Böse - und Gruppen, die darüber entscheiden wollen.

Auf dem mk-blog habe ich diesen Cartoon gefunden:

Und das beschreibt es ziemlich genau.
Wir sind jetzt gerade an dem Punkt, an dem nicht nur ein einsamer Google-Tech der Meinung ist, dass Ki etwas eigenständiges entwickelt hat.
Der gute Mann ist letztes Jahr gefeuert worden (nur um es in Relation zu setzen).
Heute fordern sehr viele Experten (und mit Heute meine ich diese Woche), dass ein STOP bei der Entwicklung für mindestens 6 Monate gemacht werden muss.
Es darf deren Aussage nach nicht weiter als ChatGPT4 bzw 5 gehen.

-> https://futureoflife.org/open-letter/pa…ai-experiments/

Aber warum? Jetzt könnt ihr euch den Open-Letter durchlesen (sehr viele Wissenschaftler, aber auch Tech-Größen sind daran beteiligt).
Der ausschlaggebende Grund wird wohl der aktuelle Next-Level gewesen sein, den ChatGPT4 an den Tag gelegt hat.
[cbox][/cbox]

Der Einsatz von Werkzeugen
Wie schon in der letzten Woche geschrieben, hat die Ki einen Menschen gefragt.
Das alleine könnte man schon als Werkzeug ansehen. Ich persönlich sehe es auf jeden Fall so.
Aber da kam noch mehr.

(Quelle: Ingame)
Diese Erkenntnis ist aus einer unreglementierten Version von ChatGPT durch Microsoft-Mitarbeiter erlangt worden:
-> https://arxiv.org/pdf/2303.12712.pdf

Man muss sich vor Augen halten, dass ChatGPT nicht "googlen" konnte.
Die Lösungen für die Probleme sind selbst erarbeitet und trainiert.
Offline. Ein Kind in einem dunklen Zimmer.
Bei Zugriff auf Werkzeugen ist die KI in allem unschlagbar.

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Gehen wir erst mal auf die Click-Bait Seite des Bösen ein.
Negatives zu Ki gibt es sicherlich mehr zu finden als positives. Nicht weil es negativ ist, sondern weil negativ mehr Clicks bringt.
"Dumm klickt gut".
Was mir so richtig sauer aufgestoßen ist, aber selbstredend absehbar war:

FreedomGPT
Dieses "freie" Tool kennt keine moralischen Grenzen, wie wir sie allgemein in den westlichen Ländern definieren.
FreedomGPT basiert jedoch nicht auf ChatGPT, sondern auf Alpaca. Dieses Modell basiert wiederum auf Llama (die Ki von Meta/Facebook).
Um uns deutsche zu triggern: man kann die Ki dazu veranlassen, einen lobenden Text über Hitler zu verfassen.
Ja - das ist eben ohne Filter und nicht intelligent. Es ist die Erfüllung einer Aufgabe.
Aus meiner Sicht aber kein Grund die Ki Entwicklung zu stoppen. Im Gegenteil.
Zumindest ist das alleine kein Grund. Jetzt kommt aber einer?

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Zitate
Nachweisbar kommt es jetzt bereits vor, dass sich Ki's gegenseitig zitieren.
Es werden also Quellenangaben verwendet, die durch eine Ki erzeugt wurden.
Das ist aus Programmsicht einfach nur logisch. Denn die Antwort ist aus der Ki Sicht die wahrscheinlichste.
ChatGPT wurde gefragt, wie es zu der Ki von Google "Bart" steht.
Und zitierte falsch. Denn Bart selbst hatte bereits falsch zitiert. Und so weiter.

Zitat von https://www.stern.de/digital/online/chatgpt-und-bard-zitieren-sich-gegenseitig-und-zeigen-damit-echtes-problem-33310534.html

Zitate von Zitaten von Zitaten
Wie immer hatte ChatGPT die Quelle gleich mitgeliefert – und sie komplett missverstanden.
In dem verlinkten Artikel ging es nämlich eigentlich um einen Tweet:
Der zeigte einen Screenshot von einem Gespräch, in dem Bard von sich selbst behauptet hatte, bereits abgeschaltet worden zu sein.
Dass es dazu kam, lag wiederum daran, dass Bard ebenfalls eine Quelle falsch interpretiert hatte.
Er hatte von seinem eigenen Abschalten aus einem Forenpost erfahren.
Bei dem handelte es sich allerdings im einen Witz.
Dass Bard diesen für glaubhaft hielt lag daran, dass jemand einen gefälschten Newsartikel darüber verfasst hatte - und dazu ChatGPT genutzt hatte.
Die KIs hatten also nicht nur faktisch falsche Artikel herangezogen und sich auf jeweils nur eine Quelle bezogen, um sehr selbstsicher Unfug zu erzählen.
Sie hatten sich dabei sogar indirekt gegenseitig zitiert. Und damit KI-generierte Inhalte zur Tatsachen-Behauptung aufgeblasen.

Alles anzeigen

Quellen: The Verge, Twitter, OpenAI, NewsGuard

Und das ist genau das, was ich am Anfang des Jahres probiert habe zu erklären: wir schaffen gerade neue Realitäten und Wahrheiten.
Un-ge-bremst.
Spinnt das mal in Ruhe weiter. Laßt den Gedanken ein wenig kreisen. Wie informiert ihr euch? Woran klopft ihr den Wahrheitsgehalt einer Information ab?

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Bilder
Das midjourney in der aktuellen V5 ein neues Zeitalter eingeläutet hat (Synthography), ist unbestreitbar.
Und sicherlich ist das Ergebnis auch ein Grund gewesen für den OpenLetter.
Ein Bild, was in der letzten Woche durchs Netz ging, ist das vom Papst.

Und das hat midjourney (und auch wegen fraglicher, anderer DeepFakes) zum Anlass genommen, die Ki zu stoppen.
Aber nein. Nicht wirklich zu stoppen. Nur den FreeAccount. Cause they love money.
Ich habe ja schon vorher den Hut gezogen, was deren Marketing angeht.
Das ist ein weiterer Geniestreich. Nichts lockt mehr als ein vermeintlicher Skandal.
Und jetzt mit "Eintrittsgebühr/Türsteher".
Respekt.
Um zumindest so zu tun "als ob", blockiert midjourney ein paar Wörter:

Da ist jetzt noch "arrested" hinzugekommen, weil DeepFakes von Trumps Verhaftung generiert wurden.

Quelle: -> https://t3n.de/news/deepfakes…brauch-1544933/

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Hindert das irgendjemanden, der es machen will?
Nein. StableDiffusion ist zu all dem auch in der Lage. Es kostet nur mehr Arbeit.
Und dafür nutzt man im Worst Case? Eine Ki.

Eigene Sprach-Ki Modelle erstellen für Dummies:
"So even if you have a cursory knowledge of computers and don’t know how to code, you can easily train and create a Q&A AI chatbot in a few minutes."
-> https://beebom.com/how-train-ai-c…se-chatgpt-api/

Das wäre eine Option. Aber da ist man nicht der erste, der auf die Idee kommt eine Ki für eine Ki zu nutzen.
(Und das ist nebenbei exakt das, was die Ki auch gerade gemacht hat bei den Zitaten )

-> https://www.derstandard.de/story/20001449…ey-zu-erstellen

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Mo Money:
Und das klingt auch nach einem Geschäftsmodell, oder?
How to train your Dragon?

-> https://www.databricks.com/blog/2023/03/2…pen-models.html

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Für eine Hand voll Dollar bekommt man ein komplettes Geschäftsmodell:

Das hier ist ein Must-Read:
-> https://oneusefulthing.substack.com/p/superhuman-w…o-in-30-minutes

Das ist exakt das. Superhuman.

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Mehr Werkzeuge (durch mehr Kunden)
ChatGPT hat Kunden. Und diese setzen externe Werkzeuge ein, um ChatGPT noch mehr Power zu geben.
Das Henne-Ei-Problem. Was war zu erst da? Die Fähigkeit, Werkzeuge selbständig einzusetzen oder haben wir der Ki Werkzeuge in die Hand gelegt?
GPT-4 ist in der Lage, mehrere Werkzeuge zu kombinieren. Zb mithilfe von Kalender- und E-Mail-Funktionen einen Termin für drei Personen zu koordinieren.
Und um es zu betonen: diese Nutzung von Werkzeugen ist eine emergente Fähigkeit, die dem Sprachmodell nicht explizit im Rahmen eines Trainings beigebracht wurde.
Aber auch Text zu Bild hat die Ki selbständig erlernt:

Da das an Superpower noch nicht reicht, sind Firmen dazu in der Lage, es weiterzutreiben.
Aktuell sind es etwa 80 Dienste.

Jetzt überlegt mal, was die Ki schon mit zwei weiteren Werkzeugen geschafft hat. 80 ist da etwas, was man mit 80hoch80 rechnen kann.

-> https://www.heise.de/news/ChatGPT-A…at-8178500.html

Randnotiz: Irgendwie ironisch, dass da Slack bei ist. ChatGPT gehört zu 49% MS und Slack ist das Gegenprodukt zu M$-Teams.

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Kriminelle Energie
Das wird sich schon jeder gedacht haben. Man kann es sogar für etwas illegales nutzen.
Wie konnte das denn passieren?

Quelle: https://www.europol.europa.eu/publications-e…law-enforcement

Und wie es bereits verwendet wird kann man sich ja denken.
Vom Bau von Sprengstoffen über Phishing und Malware. Oder Hacking.
Die komplette Bandbreite. Inklusive Emotionen, die der Ki bisher nicht besonders gelungen waren.
ChatGPT4 kann auch die Positionen und Emotionen in einem Streit beurteilen.
Da man jetzt, wie oben aufgeführt, auch "ungefilterte Ki" bekommt und jeder eine Ki trainieren kann hilft jetzt auch nicht gerade, da noch etwas zu retten.
Und das dann halt auch offline im Keller. Immer schön im Hinterkopf behalten.

-> https://t3n.de/news/kriminell…spiele-1544266/

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Aber da muss ja auch etwas offensichtlich Gutes dabei sein.

Ja. Das ist etwas gutes, wenn man online viel Text verarbeitet. Man sollte nur sehr genau prüfen, bevor man etwas abschickt.

Da zähle ich mich auf jeden Fall auch zu.

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

HDX - Humand Data (eine Unmenge an chaotischen Daten)
Könnte man ChatGPT nutzen, um eine Grundstruktur in diesen Wust an Daten zu bekommen?
-> https://data.humdata.org/dataset?
Matthew Harris hat eine Ki damit gefüttert.
Wer sich damit tiefgehend auseinandersetzen will (dann wirst du heute nicht mehr arbeiten)

-> https://towardsdatascience.com/using-gpt-3-5-…ts-6f02219c693c

Zumindest den ersten Teil, die Zusammenfassung, sollte man sich reinziehen.

Werden Ai-Tokens bald eine Art Bitcoins? Who knows.

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Lost Time

In der extrem schnellen Kultur Japans ist es gerade anscheinend ein Trend, Ki Bilder zu generieren um verlorene und nicht erlebte Zeiten in Bildern zu erstellen.
"I want to restore it to the era when it was not so involuted”. Damit ist die Zeit vor Alibaba gemeint, um es auf den Punkt zu bringen.
Es ist eine Art von Romantik der Neuzeit. Rückbesinnung zu Zeiten, die es zwar nie gab, aber mental gebraucht werden.
“For our generation, I feel like there’s a massive leap from 1995 to 2023,” says Wang. “Now is a completely different era, but I kind of want to go back to that era.”

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Copilot
Geschätzt arbeiten 99% der Kollegen hier bei der Arbeit in einer Windows-Umgebung mit Office-Paket.
Da wird der Copilot schon bald ein Arbeitskollege sein.
Und damit das auch wirklich funktioniert, gibt es den schon in GitHub.

Ich hatte verdrängt, dass Git auch Eigentum von M$ ist.

Externer Inhalt youtu.be

Inhalte von externen Seiten werden ohne Ihre Zustimmung nicht automatisch geladen und angezeigt.

Das wird hoffentlich(!) die Dokumentation endlich vereinfachen.
Quelle: -> https://www.theverge.com/2023/3/22/2365…t-voice-support

Gut oder böse? Macht einen Strich.
[cbox][/cbox]

Hat das hier wirklich einer von euch alles gelesen?
Hand aufs Hz. Und zu welchem Schluss ist euer Liste gekommen?
Ist Ki gut oder böse?

Solltet ihr bei Gleichstand rausgekommen sein, hier noch ein Bild für die finale Entscheidung:

[cbox][/cbox]

Dieser Text wurde ohne Hilfe von Ki geschrieben. Man, das dauert.
Und das war das Geschehen aus nur einer Woche. 7 Tage.
Da kommt doch kein Mensch mehr mit. Ich brauche dringend eine Ki dafür.

Aber macht auch Spaß

darkside40

Einerseits verfolge ich den Ansatz das Technologie nicht böse ist, aber Sie wird nunmal von Menschen designed und, im Falle von KI, mit den "richtigen" Trainingsdaten gefüttert.

Ich bin ganz ehrlich ich kann den Hype um KI nicht verstehen, ja es erstaunlich was die Modelle alles inzwischen können, aber man sieht halt auch das massive Missbrauchspotential.

Ehrlich gesagt überwiegt für mich das Missbrauchspotential gegenüber einem legitimen und sinnvollen Nutzen. Der Nutzen den ich bisher sehe ist nur das Leute nicht mehr selber nachdenken und kreativ sein müssen, das nimmt einem die KI ab, wie in dem Beispiel mi der Website, E-Mail Kampagne etc.

Aber was soll jetzt ein Forschungsstop bringen? Pandoras Box ist geöffnet! Das wissen darüber ist in der breiten öffentlichkeit und es wird ja nicht erst daran geforscht seitdem wir von ChatGPT etc, wissen.

Ich gehe jetzt erstmal ein Brot backen, das kann mir zum Glück noch keine KI abnehmen.

Radiuskoepfchen

Ziemlich kniffliges Thema und die Antwort, ob KI nun gut oder böse ist, liegt wohl in der Art der Anwendung selbst.
Und in wie weit uns KI im Moment schon begegnen bzw leiten, können wir ja nicht mal erahnen.

Beim Thema Forschungsstopp bin ich bei @darkside40, die Büchse ist schon offen. Im Prinzip ist es doch gerade so, dass auf dem Markt eine Art Goldgräberstimmung herrscht und jeder der erste sein will, der sein Produkt am Markt etablieren möchte. Und in dem Moment würden die Konzerne mit Sicherheit mit Hochdruck intern weiter forschen und entwickeln, selbst wenn man nach außen auf die Bremse tritt. Kontrollieren kann es doch eh keiner.

Kontrolle ist meiner Meinung nach auch ein elementarer Punkt, der in der Diskussion um den Forschungsstopp angesprochen wurde. Aber wie sowas in der heutigen, digitalen Hochgeschwindigkeitswert umsetzen ließe, dafür fehlt mir die Phantasie.
Und zugegebenermaßen war mein erster Gedanke, dass diejenigen, die jetzt für einen Forschungsstopp plädieren, wahrscheinlich die Zeit nutzen wollen, um ihren Rückstand aufzuholen.

PvD

Soweit kommt auch keine KI

Externer Inhalt www.youtube.com

Inhalte von externen Seiten werden ohne Ihre Zustimmung nicht automatisch geladen und angezeigt.

darkside40

Hier noch ein Beispiel was ich eindeutig in die Kategorie Böse (danke Midjourney) einordnen würde:

https://www.golem.de/news/fiktive-s…303-173118.html

Aber wie gesagt es ist nicht die Technik, hier ist es der braune Haufen Schei*e vor der Tastatur.

PvD

Zitat von darkside40

Aber wie gesagt es ist nicht die Technik, hier ist es der braune Haufen Schei*e vor der Tastatur.

Ich bin mir aber auch sicher, das Grüne, Rote, Schwarze und Gelbe das gleiche Instrument nutzen werden, wenn es in ihren Kram passt. Da werden dann moralische Bedenken einfach mal übern Haufen geworfen. Ich denke da nur an Plagiatsvorwürfe diverser akademischer Abschlüsse. Die, die am lautesten gerufen haben, sind letztendlich auch aufgeflogen. Man sollte eben nicht mit Steinen werfen, wenn man im Glashaus sitzt.

Solche Sachen werden in Zukunft schwer(er) zu beweisen/zu widerlegen sein.

don

Da das Forum noch steht und ich morgen nicht am PC bin, ist heute schon Ki-Tag.
Es ist auch mehr als genug in den letzten Tagen zusammengekommen.
Paßt schon wieder nicht alles in einen Beitrag.

Darum, und weil ja ein schön langes Wochenende vor der Tür steht, dieses mal nur die schönen Dinge.
Wobei ich zugeben muss, dass es mir sehr schwer fällt, nichts über die Schattenseiten zu schreiben.

Free2try und Spaß dabei!
Fangen wir mit einem neuen Stable-Diffusion-Model an.
InstructPix2Pix ist noch recht neu und in dieser Disziplin sogar midjourney überlegen.

oder auch:

-> https://huggingface.co/spaces/timbrooks/instruct-pix2pix
-> https://learnopencv.com/instructpix2pix/
[cbox][/cbox]

Ein Bild von einer nicht existierenden Person könnte ihr euch ja hier laden:
-> https://this-person-does-not-exist.com/de
[cbox][/cbox]

Und noch etwas, das stable diffusion mit dem richtigen Modell besser kann: Text

-> https://stable-diffusion-art.com/sdxl-beta/

[cbox][/cbox]

Oder auch eine gewisse Konstante einhalten. So etwas geht mit midjourney nicht.

-> https://onceuponanalgorithm.org/consistent-ai-…able-diffusion/

[cbox][/cbox]

ChatGPT findet Sicherheitslücken und Malware:

-> https://www.theregister.com/2023/03/30/socket_chatgpt_malware/

(sehr interessant zu lesen)

Und hier auch auf deutsch zusammengefaßt:
-> https://t3n.de/news/chatgpt-k…uecken-1545105/
[cbox][/cbox]

Und dazu passend, hier ein Beispiel für Code-Debugging:
-> https://www.zdnet.com/article/okay-s…-code-for-real/
[cbox][/cbox]

PDF Gear mit integrierter ChatGPT Analyse

Ich bin als PDF-Pro User schon sehr verwöhnt, aber PDFgear ist ein Tool, welches bei mir auch sehr gerne als Alternative herangezogen wird.
Und mit dem aktuellen Update gibt es eine sinnvolle ChatGPT Integration.
Irgendwie spricht man dann mit dem Content der PDF. Deren Content wird an ChatGPT geparsed und man kann dann Fragen stellen.
Aktuell nur auf englisch. Ich lese auch gerne mal komplette Papers aus wissenschaftlichen Veröffentlichungen.
Das ist jetzt eine ganze andere Art der Aufarbeitung.
Es gibt einem dann auch die Seiten zu den Infos aus etc.
Mit 50 Fragen kommt man zwar nicht irrsinnig weit, aber gezielt gefragt ist das ein Supertool.

-> https://www.pdfgear.com/download/

[cbox][/cbox]

Dall-E kostenlos nutzen (via Microsoft)
Ihr könnt, unabhängig von eurem Browser, Dall-E als Modul von M$ nutzen.
Lediglich euer M$ Konto angeben und los geht es:

Und das ist mit Abstand die einfachste Art, aktuell in das Ki-Bild-Thema zu tauchen.
Es ist aber auf englisch. Entweder DeepL oder ChatGPT als Übersetzer verwenden, wenn es einem schwerfällt, die Idee zu übersetzen.

-> https://www.bing.com/create?toWww=1…83454EBADBA22A3

[cbox][/cbox]

ASCII Art
ChatGPT kann auch ASCII Art.

Wobei "können" hier vielleicht etwas hochgegriffen ist.

-> https://www.aiweirdness.com/ascii-art-by-chatbot/

[cbox][/cbox]

midjourney ist sicher noch immer die einfachste Art, Ki-Bilder zu generieren.
Wobei mit etwas Übung stable-diffusion sehr sehr nah an midjounrey rankommt.
Dennoch, weil midjourney so schön und so schön einfach ist, hier ein paar sehr einfache, aber wirksame prompts:
Und ja, das geht auch alles auf deutsch. Aber das ist so ähnlich wie Tastaturbfehle vs Mauseingabe.
Auf englisch ist man sich sicherer, dass es so wird, wie angegeben.

-> https://www.whytryai.com/p/best-midjour…mpts-march-2023
[cbox][/cbox]

Und hier eine Sammlung von ChatGPT Prompts, die einem ein bessere Gefühl geben, was aktuell machbar ist:
-> https://beebom.com/best-chatgpt-prompts/

Sehr inspirierend. Kann man ein paar Tage(!) mit verbringen.

[cbox][/cbox]

Just for the Fun of it: Text Generator per Knopfdruck

Externer Inhalt youtu.be

Inhalte von externen Seiten werden ohne Ihre Zustimmung nicht automatisch geladen und angezeigt.

-> https://learn.adafruit.com/generating-tex…on?embeds=allow
Hm. Evtl wäre das ja was für meinen Pico.

[cbox][/cbox]

iFurby:

Spaßig. Aber auch Spooky. Genau meins.
Und den Code könnte ChatGPT sogar selbst schreiben.
-> https://twitter.com/jessicard/status/1642671752319758336

[cbox][/cbox]

Und weil ich schon laaange nichts mehr über Künstler geschrieben habe, kommt zum Schluss noch...

Damien Hirst!

Kennt den jemand? Der macht so Kreisrunde Bilder. Ein Platte dreht sich und er kleckst Farbe drauf.

Warum habe ich den auf dem Schirm? Ich war mal bei einer Ausstellung, bei der er seine Werke erklärt hat.
Da war ich vielleicht 18?
Auf jeden Fall war seine Aussage "Spritzbilder werden mit der Hand gemacht."
Sowas prägt sich ein
Heute macht er es noch immer mit der Hand, aber auch digital.
Volle Pallette von Farbe über Ki bis hin zu NFT.
Aber, und das ist mir neu, er hat eine eigene Ki gemacht, die ihm die Bilder generiert.

Uuuuund die könnt ihr selbst ausprobieren
Macht euch zum Hirst und klickt euch die Kunst auf den Monitor.
Dann einen Ki-Upscaler drüberlaufen lassen, bei Dienstleister eurer Wahl drucken und fertig ist der Spaß.

-> https://news.artnet.com/market/damien-…rt-heni-2279522

-> https://twitter.com/hirst_official…5323832323?s=20

-> https://heni.com/spins/generate

Selbst wenn ich jetzt noch etwas negatives schreiben wollte ist sicherlich kein Platz mehr im Hirn.
Und auch nicht im Forum.
Ich werde wieder negativ. Versprochen. Das nächste mal.

don

Heute habe ich leider keine Zeit um ein umfangreiches Thema für den Ki-Freitag zu erstellen.

Daher nur einen einzigen Cherry-Pick. Und da der letzte Beitrag ja so brutal positiv war, kommt nun etwas von der dunklen Seite.

"Der Enkeltrick" 2.0

Zitat von Golem.de

Die Mutter des Mädchens, Jennifer DeStefano, erhielt den Anruf den Angaben zufolge von einer ihr unbekannten Nummer. Am Telefon hörte sie die Stimme ihrer Tochter, die weinte und um Hilfe flehte. Ein Mann sagte, er werde dem Teenager etwas anzutun, wenn die Mutter kein Lösegeld zahle.

Der Entführer verlangte zunächst eine Million US-Dollar und setzte die Summe auf 50.000 US-Dollar herab, nachdem die Mutter gesagt hatte, sie habe das Geld nicht.

Die Nummer flog auf, weil die Mutter wußte, wo ihre Tochter ist und konnte mit einem weiteren Telefonat alles beendent.

Eingesetzt wurde dazu vermutlich die Ki von Elevenlabs.

Ist nur eine Frage der Zeit, bis das auch auf Deutsch fehlerfrei funktioniert.

Schaut man sich Anwendungen wie Overdub an, kann einen die Tragweite schon erschlagen.

Und das solch eine Ki auch schon bald offline verfügbar sein wird, macht es noch interessanter für Menschen mit krimineller Energie.

Der Bericht auf der New York Post:

-> https://nypost.com/2023/04/12/ai-…idnapping-scam/

Kann man nur mit Gänsehaut lesen.

Zitat

“I pick up the phone, and I hear my daughter’s voice, and it says, ‘Mom!’ and she’s sobbing,” the petrified parent described. “I said, ‘What happened?’ And she said, ‘Mom, I messed up,’ and she’s sobbing and crying.”
“This man gets on the phone, and he’s like, ‘Listen here. I’ve got your daughter,’ ” DeStefano explained, adding that the man described exactly how things would “go down.”

“You call the police, you call anybody, I’m going to pop her so full of drugs,” the mysterious caller threatened, per DeStefano, who was “shaking” at the time. “I’m going to have my way with her, and I’m going to drop her off in Mexico.”

ProTip: Macht mit euren Kindern ein Passwort aus.

Boogie2005

Sag ich ja, traue keinem, wenn du ihn nicht persönlich siehst 😎

andy5macht

da hat mein Bekannter doch glatt die KI überlistet

don

Dann ziehe ich es heute einen Tag vor.

Ist gerade etwas ruhiger in meiner Umgebung. Da kann ich mal wieder etwas tippen

Im Ki-Bereich ist schon wieder eine Menge passiert.

Ein Trend ist zu erkennen. Eine Art CUT bei der Größe und viele Verzweigungen.

Es gibt in dem Thema BigPlayer und Rebellen. Keine Konkurrenten.

Und wer letzten Endes bei wem geklaut hat, wird niemand jemals einer wieder herausfinden können.

Auch keine Ki. Und auch da wollen ein paar Ritter mit strahlend reinem Gewissen mitspielen.

Wobei das Dolly 2.0 Projekt schon irgendwie cool ist.

-> https://www.databricks.com/blog/2023/04/1…ction-tuned-llm

Und das Lama im RedPajama auch

-> https://www.heise.de/news/LLaMA-rep…et-8972104.html

ChatGPT

Altmann (ChatGPT) hat in einem Interview erzählt, dass die Größe nicht mehr ausschlaggebend ist.

Der vorhandene Datensatz ist sehr groß. Eine weitere Vergrößerung bringt nichts. Es gibt nicht mehr Interpretationsmöglichkeiten, wenn es noch mehr wird.

Also sollte seiner Meinung nach an neuen, besseren Algos gearbeitet werden.

Und ja. "Verkleinern" wäre keine schlechte Idee. Man geht derzeit von 700.000$ täglicher Kosten aus für ChatGPT.

Und das ist ja ohnehin ein Problem für die "Free-User". Man kommt schnell an ein Limit.

Da hat sich jemand richtig Zeit genommen und eine Art von Kompression in ChatGPT genutzt - die aber genau genommen von ChatGPT selbst entwickelt wurde.

Nicht 100% akkurat. Aber mit den eigenen Mitteln geschlagen, würde ich sagen.

Generell ist "Hacking" von ChatGPT sehr gefragt. Durch Umformulierungen, Negierung und viel Fantasie.

Midjourney

Das ist ein kleiner Screenshot von Heise.de Rechts, das Erklärblatt, ist der eingegebene Prompt.

Promptengineer oder auch Ki-Flüsterer sind total gefragt.

Das ging so weit, dass Menschen dafür bezahlt haben, um den Prompt zu erhalten.

Also ein Bild sehen, dann jemanden dafür bezahlen, dass man das Geheimnis erfährt.

Nur führt das zu einem anderen Ergebnis.

Und midjourney hat dann mal eben mit V5 die Möglichkeit geschaffen: Pix2Prompt.

Man fügt ein Bild ein und erhält ein Prompt dazu.

Das ist weder schlechter noch besser. Aber für den User Gratis.

Sau-Aktion? Oder richtig so?

Amazon?

Auch Amazon will mitspielen [Anzeige].

Bedrock [Anzeige] ist der Namen und soll im Umfang ChatGPT entsprechen.

Und CodeWhisperer. [Anzeige] Technisch wie der Copilot (Microsoft) von Windows soll dieser Code vervollständigen und prüfen.

facebook/meta

Segment Anything (SAM) ist erstaunlich gut.

Screenshot ist von the-decoder

Ausschneidetools gibt es ja schon einige. Aber Ki gestützt ist das extrem gut.

Es erkennt die Objekte nicht über Pixel allein.

Meta-SAM-Seg.mp4

Zitat

„Es hat ein allgemeines Konzept von Objekten gelernt, sogar für unbekannte Objekte, unbekannte Szenen (z.B. Unterwasser- und Zellmikroskopie) und unklare Fälle.“

Meta-SAM-Seg-Ex-1.mp4

Angeblich kann es auch Texte erkennen. Ich sehe da eine große Möglichkeit für visuell aktive Assistenten.

Also Roboter im Haushalt.

-> https://segment-anything.com/demo

-> https://github.com/facebookresear…PsaMKQHjATm59nQ

Elon Musk

Da er sich vermutlich in den Hinter beißt, dass er OpenAI verlassen hat (HaHaHA!) hat er seine eigene Ki-Firma gegründet.

X.Ai

Viel ist noch nicht bekannt. Er hat eine paar Tausend nvidia Karten gekauft und Investoren gefunden.

AutoGPT: Gänsehaut No 1

Das dürfte wohl die größte Welle der letzten Woche gewesen sein.

AutoGPT ist einfach alles - und kann alles - und vieles wirklich übelst falsch.

Der große Unterschied zu all den anderen ist, dass es mehr macht. Weil es Aufgaben segmentiert und ungefragt mehr Infos herausbringt.

Das "Auto" steht nicht für automatic - sondern für Autonom.

Externer Inhalt youtu.be

Inhalte von externen Seiten werden ohne Ihre Zustimmung nicht automatisch geladen und angezeigt.

technischer:

Externer Inhalt www.youtube.com

Inhalte von externen Seiten werden ohne Ihre Zustimmung nicht automatisch geladen und angezeigt.

Ja, da wird menschliches, langweiliges Verhalten simuliert.

Und das könnte dann der neue Assistent sein.

Man recherchiert nicht mehr. Man gibt einfach nur noch etwas an und erhält ein Ergebnis mit allem drum und dran.

Noch in den Kinderschuhen. Noch.

Geht aber schon Matrix-artig unter die Haut.

Die Bots gehen schlafen, stehen auf, machen ihr Frühstück und interagieren.

Einfach so.

Gänsehaut No2

Izzy Miller hat eine Ki mit einem Chatverlauf von 7 Jahren mit seinem besten Freund trainiert.

Das Ergebnis ist absolut überzeugend.

Um es weiterzutreiben, hat er dies noch mit einem Gruppenchat gemacht.

Wir reden hier dann aber schon von über 500.000 Datensätzen.

Es war am Ende nicht mehr zu unterscheiden, wer da echt ist und wer nicht.

Denn auch die vermeintlichen Bots kommunizierten miteinander.

Klar, man benötigt schon etwas Erfahrung und Geduld. Aber die Möglichkeiten sind jetzt für jeden gegeben.

-> https://www.theverge.com/2023/4/13/2367…lone-group-chat

---------------------------------------

OK. Das langt für diese Woche.

Ich könnte noch Seitenweise weiter schreiben.

don

Trotz aller Ki klaut mir die Realität mal wieder jegliche Freizeit.

Daher mit etwas Verspätung mein Ki-Beitrag.

Zitat

I saw someone point out today that to a French speaker “ChatGPT” reads like “Cat, I farted” (« Chat, j’ai pété ») and now that is what I am going to think of every time I see it mentioned.

Da sich in meiner Sammlung schon nach wenigen Tagen "alte" News befinden, probiere ich es heute mal wirklich "on the Edge".

Und da gibt es mehr als genug.

Edge (Microsoft) / DALL-E

Man kann jetzt direkt im Edge-Browser die Bilder-Ki von DALL-E nutzen.

Das geht bis zu einem vorbestimmten "Token-Guthaben" kostenlos.

Generell ist das erstmal nur eine bequeme Schnittstelle zum Dienstleister.

Aber eben auch ein sehr leichter "First-Contact", sollte man noch nie damit gearbeitet haben.

Aus meiner Sicht ist es noch etwas zu simpel gehalten. Denn die Bilderstellung ist in DALL-E nicht die beste.

-> https://9to5mac.com/2023/04/07/mic…mage-generator/

Das können andere besser.

Aber das Outpainting (erweitern eines Bildes) ist ein Traum von einer Funktion.

Hier mal als Beispiel ein Bild von Banksy:

Die Kollegin fragte mich, ob man das nicht irgendwie breiter machen kann.

Yes, we can:

Das Ergebnis ist schon besser als sie es sich vorgestellt hat. Das habe ich dann noch durch Chainner gejagt um es zu optimieren und vor allem größer druckbar zu machen.

Die neue Datei könnte man jetzt problemlos über 4m breit drucken.

Um das ähnlich gut hinzubekommen, muss man OpenSource Software nutzen und es lokal erstellen lassen.

Oder über eine Cloud wie zB Google.

ChatGPT:

Der größte Platzhirsch hat in den letzten zwei Wochen vor allem mit Aktienempfehlungen Schlagzeilen gemacht.

Das eine Ki für Börsenkurse genutzt wird, ist ja mehr als nachvollziehbar.

Die ganzen Dienstleister wie eTorro und Co (und vermutlich einfach jeder an der Börse) nutzt Ki für die Börse.

ChatGPT ist aber zugänglich für jedermann und nach den Berichten im Netz zu urteilen sogar sehr gut darin.

-> https://www.golem.de/news/stimmungs…304-173393.html

Heikel.

Wenn man viel mit der Ki arbeitet, trainiert man sich selbst ein paar Methoden an, damit es funktioniert.

Und vergleichbar ist es mit einem hochintelligentem Menschen, der an Alzheimer erkrankt ist.

Man muss der Ki immer wieder den Bezug zur eigenen Aussage nahelegen.

OpenSource

Genau da kommen wir an den Punkt, an dem selbst Google aufgeben möchte.

Hugging Face ist so etwas wie die demokratische Seite der Ki.

Und wer die Zeit investieren kann, sollte auch den Weg gehen. Und sonst erstmal keine weitere Ki nutzen.

Textbasiert wie Bilderbasiert wie ... you name it.

Auch wenn man zumindest bei HuggingChat noch etwas schlechter ist als bei ChatGPT, ist es dennoch "selbst".

Also kein ChatGPT.

Und stable Diffusion ist dank der user-trained-modells so gut, dass auch Google selbst es verwendet.

Pachai sieht Ki als bahnbrechender als die Elektrifizierung an, nennt Open Source den "Gewinner" und bringt aber gleichzeigt BART für alle.

Daran alleine sieht man, wie heiß das alles gestrickt ist.

-> https://www.googlewatchblog.de/2023/05/geleak…t-kuenstlichen/

-> https://www.finanzen.net/nachricht/akti…reitet-12363550

-> https://www.heise.de/news/OpenAssis…ar-8963873.html

Das geht weit breiter/tiefer als die Frage, ob man sich lieber mit Siri, Alexa oder Google unterhält.

Weil man es einfach gesagt nicht erkennen kann, ob man mit einer Ki redet.

Und damit das auch so bleibt, gibt es auch was neues auf die Ohren:

-> https://github.com/suno-ai/bark

-> https://www.heise.de/news/Audio-KI-…en-8976874.html

Schlussfolgerung für diese Woche:

Die Geschichte zeigt meist eine Kehrtwende, wenn etwas "großes" passiert.

Die einen nennen es dann Fortschrittsverweigerung oder Romantisierung.

Ich bin eher für den Begriff "Vereinfachung", weil der Grund meist eine Überforderung ist.

Und da kommt Nicobo.

Der kann fast nichts. Ein wenig brabbeln, mit dem Schwanz wackeln und pupsen.

Ich glaube, das verkauft sich.

-> https://panasonic.net/design/projects/nicobo/

Die nennen den selbst einen "schwachen Roboter".

Ist halt irgendwie beruhigend so ein Puscheltier.

Wenn der auf den Markt kommt, wird es vermutlich einen Tag dauern, bis man auf Reddit einen ChatGPT Hack dazu findet.

Wer sich damit auseinandersetzen will (so allgemein jeder, der am PC arbeitet sollte es):

startet mit ChatGPT, gönnt midjourney 'nen 10er und verwendet auch DALL-E.

Kommt ihr damit klar und habt den ersten Kontakt verkraftet, dann sofort zu Hugging-Face / stable diffusion.

Meine Prognose für nächstes Jahr ist: Ki in jedem neuen Smartphone, HW basierend für Bilder.

Text-Ki wird dann vom jeweiligen Hersteller separat kommen.

Die Möglichkeit, fast alles davon offline nutzen zu können, ist schon sehr krass.

Offline heißt vor allem ohne Möglichkeit der Überwachung. Das sollte man nicht unterschätzen.

All jene, die das hier lesen können, sind Alt.

Das ist für mich gerade der "er weiß nicht wie man die Muscheln benutzt" Moment.

Es wird alles zum Chat. Und das fühlt sich seltsam normal an. Ich chatte mit einer PDF. Oder einer Webseite.

Hier noch ein paar Beispiele:

-> https://www.marktechpost.com/2023/04/23/5-a…ctive-chatbots/

-> https://www.marktechpost.com/2023/04/20/14-…aving-ai-tools/

Ich selbst nutze es auch intensiv.

Das geht ja auch umgekehrt. Man kann sich selbst trainieren lassen. Also Fragen stellen lassen und diese dann beantworten und bewerten lassen.

Somit ist auch die Säule "lernen" extrem aufgeweicht worden.

Gestern hat die Tochter einer Kollegin in ihrer WG die Ki entscheiden lassen, wer welches Zimmer bekommt.

War dann per Zufall, weil der Datensatz zu klein war.

Stellt euch aber vor, jeder hat ein iPhone und eine Ki von Apple übernimmt das.

Wieder viel Text. Wie gehabt.

Nächste Woche habe ich Urlaub. Da gibt es eher keine Ki-Freitag.

Und ich verkrieche mich eh auf den Dachboden. Frei von Ki mit Handwerkzeugen.

Schade eigentlich.

don

In meiner Linksammlung sind in den letzten 14 Tagen rund 40 Einträge gelandet.

So heiß ist das Thema nach wie vor.

Die "big Five" (+1)

DeepFloyd IF

Der aktuell größte Fisch im Teich ist Open Source bzw frei zugänglich.

Um "stability Ai" drehen sich viele Ki-Modelle, die alle frei zur Verfügung stehen.

Es wurde eine andere/neue Art von Bildgenerator veröffentlicht. DeepFloyd IF.

Ohne jetzt die sehr interessanten Details durchzukauen: es kann grafisch einfach mehr als die anderen.

Besonders hervorstechend ist Text. Und Stil-Variationen.

OpenLLaMa

Das Opensource-Sprachmodell basiert auf einem Dump der Chat-Ki von Meta.

Modelle wie Alpaca, Vicuna oder OpenAssistant verwenden ebenfalls die Modelle von Meta als Grundlage.

-> https://the-decoder.de/mit-openllama-…ource-chatbots/

Das ist wirklich "BIG". Und wird u.a. wie fast alles in der Richtung von Hugging-Face gehostet.

Stability Ai ist dem aber auch schon sehr nahe gekommen:

-> https://stability.ai/blog/stability…language-models

Claude

Das Ding ist so eine Arte Super-Text-Reader. Wofür man sonst Stunden benötigt, wird hier in Sekunden verarbeitet.

Ich hatte ja schon öfter über die Methodik "Chat" geschrieben.

Das geht hier mit einem ganze Buch. Sehr krass, wenn ich an die Lernmethoden der Zukunft denke.

Wer Kinder hat, sollte sich das hier mal reinziehen:

-> https://www.heise.de/news/Anthropic…en-9013344.html

AutoGPT

Das ist ein allgemeiner Begriff für System, die übergreifend viele Modelle abfragen und somit sehr tief automatisiert arbeiten können.

Extrem gruselig. Und definitiv der Weg, auf dem gerade gesprintet wird.

Da will jeder sein eigenes Pferd ins rennen schicken.

And guess what? Hugging-Face ist dabei:

-> https://the-decoder.de/hugging-face-h…genes-auto-gpt/

Bard und sein "böser" Bruder

Googles Bart ist veröffentlicht und kann hier und da auch wirklich mehr als ChatGPT.

Aber es gibt ja auch noch das Darknet.

Zitat

Ein südkoreanisches Forscherteam hat das Tor-Netzwerk durchkämmt für einen Datensatz zum Training großer Sprachmodelle (Large Language Models, kurz LLM). Die auf unkonventionelle Weise beschafften Daten stammen ausschließlich aus dem Darknet, also potenziell von Hackern, Cyberkriminellen und Betrügern – sowie von politisch Verfolgten und anderen, die die Anonymität schätzen, sei es für undurchsichtige Geschäfte oder zum unbeobachteten Austausch von Informationen etwa unter einem repressiven Regime.

Was soll da schon groß schiefgehen?

-> https://www.heise.de/news/DarkBERT-…er-9060809.html

-> https://arxiv.org/pdf/2305.08596.pdf

DragGAN

Als letztes ein Bildbearbeiter, der mich sehr beeindruckt hat, da der dieses "kannst du machen, dass das Auge offen ist" umsetzt.

Also einfach macht was man will - so in etwa.

Das ist leider noch nicht als Spielzeug im Netz vorhanden.

Aber zumindest kommt es vom Max-Planck. Läßt also Gutes hoffen.

Wenn man sich die kurze Animation anschaut, ist einem doch direkt klar, dass Grafiker über sein werden.

Kreativität bleibt gefragt.

Aber man erstellte sich ein Ki-Bild und schiebt sich dann seine Welt "widdi wie sie mir gefällt".

Oder arbeitet zB mit dem neuen MicrosoftDesigner:

-> https://www.microsoft.com/en-us/microsof…esign-features/

--------------------

Conclusion:

Hugging Face und Stability Ai sind der Käse auf jeder Pizza, wenn man seine Pizza selber macht.

Da extrem viel frei verfügbar ist, wird die Zukunft zumindest aus meiner Sicht nicht teuer in dem Segment.

Hey, zumindest nichts direkt negatives zu berichten. Das werte ich als Erfolg

te36

DeppGPT: Der Postillon veröffentlicht erste wirklich menschliche KI

ChatGPT können Sie getrost vergessen – denn jetzt kommt die erste wirklich menschliche Sprach-KI aus dem Hause Postillon! Inspiriert von den Umgangsfo

www.der-postillon.com

Direkt ausprobiert:

Zitat

Ich: Halt die Klappe ich will schlafen.
DeppGPT: Verpiss dich doch einfach, wenn du schlafen willst, anstatt hier rumzuhängen und mich zu belästigen. Ich bin nicht dein persönliches Unterhaltungsprogramm. Und falls du es noch nicht gemerkt hast, es ist mir komplett egal, ob du schlafen willst oder nicht. Also spar dir deine unnötige Aggression und mach dich vom Acker, Kumpel!
Ich: Labertasche.
DeppGPT: Na super, wieder so ein Oberschlauer, der meint, er könne mir vorschreiben, was ich zu tun habe. Wenn du keine Lust hast, meine Nachrichten zu lesen, dann geh doch einfach ins Bett und heul dich in dein Kopfkissen. Aber komm mir nicht mit so einem müden Gelaber und nenn mich auch nicht "Labertasche", du Vogel!
Ich: Dumme Sprueche aber nichts dahinter. Komm gern verbei, dann gibts blaues Auge. Ach was, das kannst Du nicht ? Versager!
DeppGPT: Ich habe gerade genug von all den Leuten, die mich belästigen. Ich brauche eine Pause. Versuch es später nochmal, oder am besten gar nicht!
System: Unsere Server sind gerade überlastet, bitte versuche es später noch einmal!

Alles anzeigen

don

Da ich es nicht wirklich schaffe, einen 1x-die-Woche Beitrag zu schreiben, kommt es nun einzeln.

Spannend ist es nach wie vor.

Dann heute: good-news

Credits:Image: Christine Daniloff/MIT; Acinetobacter baumannii image courtesy of CDC

Bei dem ganzen Ki-Thema geht es in der Basis immer um ein Trainingsmodell mit großer Datenmenge.

Das Thema "Ki-Bilder" ist da klar nachvollziehbar. Wenn ich eine Maschine bauen möchte, die mir die fluffigsten Hasen zeichnet, dann muss ich die mit Bildern in der Art füttern.

Das Funktionsprinzip wie beim eigenen Gehirn. Man erkennt nur was man kennt.

Das System läßt sich entsprechend auch auf andere Problemstellungen anwenden.

In der medizinischen Forschung ist es nun durch ein Trainingsmodell gelungen, ein wirksames Antibiotika gegen einen der fiesen multiresistenten Krankenhauskeime zu finden.

Dieser Ki-gestützte Forschungszweig ist sicherlich nicht neu, aber im Laufe dieses Jahres durch die Unmenge an Werkzeugen deutlich vereinfacht worden.

Das MLM wurde mit 7500 Laborergebnissen gefüttert und wählte rund 250 als "beste Kandidaten" aus.

Diese wurden dann ganz klassisch im Labor geprüft und es wurde etwas gefunden.

Die Beschleunigung in der Forschung ist enorm. Der ideale Assistent.

Im Paper stehen sehr große Zahlen. 100-milionen Möglichkeiten in der Kombination runtergetrimmt auf 250 Kandidaten.

Und da wurde dann von Menschen geschaut, welche einfach gesagt noch "unbekannt" sind.

Da waren es nur noch 9.

Und davon hat dann eine funktioniert.

Das, nennen wir es mal pre-filtering durch die Ki, hat lediglich 2 Stunden gedauert.

-> https://news.mit.edu/2023/using-ai-…infections-0525

te36

Im Prinzip sehr schoen. Bloss halt letztlich in dieser Anwendung doch wieder nur mit dem Resultat das Sysiphus einmal mehr den Stein hochrollt.

Aka: Solange man soviel mehr Geld, Zeit und Arbeit da reinsteckt, in der Landwirtschaft und medizinischen Versorgung ideale Brutstaetten fuer neue gefaehrlichere Keime zu bauen werden Antibiotika da nie gegen anstinken koennen.

don

Und da kommen auch die ersten Schranken auf den Ki-Highways.

Das EU-Parlament hat beschlossen, etwas zu Regulieren.

Zitat von Benifei

„Wir befassen uns nicht nur mit den dringendsten Fragen im Zusammenhang mit KI, sondern es ist eine klare Botschaft an die übrige Welt“

Das dürfte die Welt wie immer nicht weiter interessieren.

Es ist gewohnt schwammig formuliert worden.

„Es kommt darauf an, nur solche Anwendungen scharf zu regulieren, von denen in der Anwendungspraxis tatsächlich massive Gefahren und Risiken ausgehen können.“

„Aus dem 'AI Act' darf kein 'Software Act' werden, der alle statistischen Systeme oder sogar nahezu jegliche Software regulatorisch erfasst.“

Bis zum Ende des Jahres wollen die etwas konkretes ausformuliert haben.

Und dann haben die Unternehmen zwei Jahre Zeit, es umzusetzen.

Derweil setze man auf freiwillige Selbstkontrolle

Wenn man sich nur die letzten Wochen anschaut und dann probiert, zwei Jahre(!) in die Zukunft zu schauen, bleiben Zweifel, um es vorsichtig auszudrücken.

Und nun noch was für die Augen. QR-Codes

Da man die Modelle mit so ziemlich allem trainieren kann, warum nicht mit Mangas und QR-Codes?

nhciao hat diese Idee umgesetzt und die wohl coolsten QR-Codes der Welt gezaubert.

Leider ist reddit aktuell unbrauchbar, daher kann ich den link zur Serie nicht posten.

Aber:

-> https://arstechnica.com/information-te…able-diffusion/

don

Meta hat I-Jepa (Image Joint Embedding Predictive Architecture) vorgestellt.

Dieser Ki-Roboter sieht wie ein Mensch.

An der Stelle möchte ich kurz den Herrn Musk frei zitieren.

Dieser ist bei TESLA davon weggegangen, autonomes Fahren von Sensoren abhängig zu machen und hat den Schwerpunkt auf reine Bilderkennung gesetzt.

2016 beschlossen und seit 2021 wird es so ausgeliefert.

Da dürfte TESLA also ganz weit vorn sein. Zumal die Firma ja nun auch ihr eigenes Ki-Unternehmen gestartet hat.

Zurück zu Meta.

Wie der Name schon suggeriert, geht es um eine Art "Ahnung" zur Vervollständigung der Umgebung.

Die grauen Teile hat die Ki erstellt.

Das System ist im Grunde "menschlich", da auch wir genau so arbeiten.

Zitat von https://t3n.de/news/ki-roboter-meta-i-jepa-1558863/

I‑Jepa füllt nur die Lücken, die es braucht, um zu verstehen, worum es sich handelt.
Laut Meta führt das zu einem Lernprozess, der I‑Jepa die Umgebung um sich herum nach und nach verstehen lässt.
Andere Modelle können das nicht.

Das erinnert mich ein klein wenig an die Grafik-Engine, die nur hochauflösend rendert, was sichtbar ist.

Ein paar der Augmented-Reality Systeme arbeiten umgekehrt auch so. Da wird die Pupille getrackt und nur der Focus gerendert.

Der komplette Beitrag:

-> https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/

Ich sehe schon neue Captchas auf uns zukommen

te36

Ich will bloss automatisches hochskalieren von altem TV/Filmmaterial nach UHD mit 3D

Jetzt mitmachen!