[blog] Bilder-Ki midjourney stable diffusion dall-e

  • Ne das war Absicht, habe ich der Ki so gesagt. [ag]

    Die Karre ist ja auch eher Sofaersatz [ag]

    Spoiler anzeigen

    Client: Nvidia Shield 2019 Pro Kodi 20.1, AVR Sony STR-DN 1080, Nubert NuBox Series 5.1, LG TV 55SM8600 Nanocell
    Musik über Pi4 mit Picore 8 und LMS am AVR.
    Gästezimmer:Shield TV 2017 Kodi 20.1
    Server: unRaid; Fractal Des. Define 7;Asrock B365M PROF-4, Intel i3-8100, 16GB RAM und 20TB Platten,
    Arbeitstier: DeepSilence 4, AX370M, AMD Ryzen 5 2600X; 8GB RAM, Samsung M2 970EVO 500GB, RX560 Grafik

  • OK. Das ist sehr gut, aber gar nicht das was ich wollte.
    Dennoch einfach sehr gut.

    Ich wollte die drei Affen (oder vier) Minai, Kikanai, Iwanai als Porzellan-Figuren mit weißem Hintergrund.
    "Minai, Kikanai, Iwanai in porcellaine, white brackground /relax"

    Jetzt wird es Zeit, dass die 3D Ki das als druckbare Datei umsetzt.
    Ich kann es noch immer nicht wirklich greifen, verarbeiten, in-den-Kopf-bekommen, dass das alles nicht zusammengestellte Bilder sind, sondern von der Ki neu erstellte Motive.

  • Wie gut kann midjourney auch Bilder erzeugen, die photorealistisch sind ? Landschaften, Tiere, Pflanzen, Gebaeude, Raeume ?

    Glaube ich habe den Versuch des Photorealismus bisher nur bei Personen/Gesichter/Klamotten gesehen. Evtl. halt mittelalterliche Staedte - dafuer gibts halt soviel Phantasy/Game Vorlagen, aber das gilt IMHO auch nicht so richtig. Wobei halt etwas, was an Niederlaendische Gemaelde erinnert fuer mich eher real wirkt als etwas, was an ein Mittelalter Siel erinnert.

    Freistehender Kaminofen schwarzes Blech Stil 2020 ? ;)

  • Eine kleine Odyssee mit Snoopy.

    Anweisung:
    snoopy standing under a umbrella, multi colour ink is raining, snoopy stays white, street art, banksy style

    DreamStudio (Stable Diffusion basierend):

    midjourney:

    midjourney mit diesem Bild gefüttert:

    Anweisung: with snoopy under the umbrella instead of the man
    Ergebnis:

    Und nun der "Trick". Sprich wie mit einem 4 jährigen Kind.
    Anweisung:
    snoopy, holding and standing under a umbrella, colour is raining, snoopy stays white, the colour all over the ground, street art

    schon deutlich besser. bedingt durch mehr details.

    Einfach noch mal den gleichen Text eingegeben, und:

    Jetzt wäre eine Mischung aus links und rechts unten mein Ziel.
    Rechts die Spiegelung in der Pfütze ist schon beeindruckend. Wäre auf jeden Fall mit dem Schirm und der Schattierung ein geniales Piece.

    Dann das Bild als Input genommen
    Anweisung: but with a happy face

    OK. Das war nicht so clever. Kein Bezug zum vorherigen Text. Ist halt nicht ChatGPT. Und ich Honk habe das komplette vierer Set als Quelle genommen.

    Dann wieder zurück zur Eingangsphrase.
    snoopy, smiling, holding and standing under a umbrella, colour is raining, snoopy stays white, the colour all over the ground, street art

    Nah dran. Aber wo ist der Farbregen hin?

    Besser wird es nicht.
    Das Problem ist die sehr sehr hohe Rate an Variablen. Selbst bei identischer Eingabe kommen unterschiedliche Ergebnisse.
    Das macht es spannend, aber wenig produktiv.

    Hier mal ein sehr gutes Bild mit Beschreibung:


    Anweisung:
    Beautiful African warrior princess holding a spear perfect composition, beautiful detailed intricate, vividly detailed octane render, trending on artstation 8k artistic photography, photorealistic concept, soft volumetric cinematic perfect light

    Ich habe es exakt so eingefügt, und das kam dabei heraus:

    Und aus Spaß habe ich ein Bild von mir im Stil von Egon Schiele machen lassen

    Das paßt nicht mal im Ansatz. Könnte nicht mal ein Cousin von mir sein. Dermaßen weit weg...
    Aber witzig. Bringt mich nur nicht weiter.

  • Wie lange muss man da jeweils fuer ein Bild rendering warten ?

    Morgen ist fuer mich Winterzeit vorbei. Ist das hier die Bestellhotline fuer einen neuen Charlie Brown Avatar ?

    Charlie Brown original Schulz style 2 dimentional color standing under umbrella,.... ;)

  • Läuft das Ganze eigentlich lokal auf dem Rechner? Oder mittels API? Mir ist nur aufgefallen, dass die Texte auf den Bildern - sofern vorhanden - etwas wirr sind... ist das normal?

    Wäre auch interessant zu wissen, was man aus einem vorhandenen Profilbild so alles herzaubern kann. Naja, ich kann es selbst eh nicht testen.

    Allgemein gesagt - sind die Ergebnisse schon sehr beeindruckend, aber auch erschreckend zugleich. Es hängt immer davon ab, was man daraus macht und wie / mit welchem Ziel man die KI einsetzt.

  • Da gibt es mehrere Ansätze.
    Stable-Diffusion läßt sich lokal installieren.
    Dall-E ist nicht lokal, etwas langsamer, aber bietet eine recht leichte Möglichkeit, das generierte Bild weiter zu verändern
    midjourney läuft komplett in Discord (also 100% Cloud)
    Und dann gibt es noch self-hosting Projekte, bei denen man die Google-Cloud nutzt. Ist also privat, aber in der Cloud

    Meine Ergebnisse sind fast alle mit midjourney gemacht.

    Und bei allen ist das Ergebnis an sich sehr unterschiedlich bei gleichem Befehl.
    Und dann auch noch mal unterschiedlich, wenn man den Befehl einfach wiederholt.

    Text ist kein Text sondern die optische Vorstellung von Text als Bild.
    Ich habe bisher noch keine Bilder-Ki gefunden, die ordentlich mit Text umgeht.

    Ich bin da so halb-intensiv beim Testen. Aktuell ist es eher inspirierend als fix-und-fertig nutzbar.
    Denn da trennt sich die Spreu vom Weizen. "Ja so, aber mit dem Teil vorn" kann man nicht als Variable nach der Erstellung angeben.
    Und eben auch nicht wiederholen.
    Da mögen 25 Jahre Präzisionsarbeit in der Vektrografik in meinem Kopf auch etwas im Weg sein.
    Aber "im realen Arbeitsleben" nutzbar ist es bestenfalls für T-Shirts oder eben als Inspiration.
    Oder als Bindeglied. Ich erstelle etwas in Midjourney, zeige es einem Kunden und lasse es dann über Fiverr o.ä. als Produkt (Webseite, Katalog, Schildvorlage etc) herstellen.

    Das ganze Ki-Spektrum ist in den letzten Monaten extrem explodiert.
    Dazu schreibe ich aber noch etwas separat. Es gibt durchaus ein paar Dienstleister, die man praktisch nutzen kann.

  • cat falling from a tree filmed by a fish eye camera

    mushroom, skull, bioluminescense


    full length , vanta-dinosaur Viking empress, Devon Aoki, valkyrie headdress helmet, ornate carnvial glass scaled armor, beautiful filagree accents, opalescent indentations, chromatic reflections, cinematic, dynamic angle, crystal , In the style of Ray Caesar + Yoshitomo Nara + Mab Graves


    Dead Space Isaac Clarke, Thick Acrylic Illustration by Casey Baugh, artgerm


    **4K realistic beautiful woman 35 year old brown hair natural slim athletic sitting cross legged massing touching her feet, hands on feet, sun, light, coloured spiritual background, linen clothes


    spider, in the style of Takashi Murakami

    spartan skeleton

    very realistic photography Elegant Wagnerian death shroud skull floral vines astrology art nouveau with flourishes by Agostino Arrivabene Anna Dittmann and Hsiao Ron Cheng and Mark Demsteader, finely detailed hood, golden filigree, stylized, cinematic lighting, chiaroscuro, shadows, donato giancola, intricate detail, realism


    geometrical lines of laughing birds, geometrical lines of flowers, geometrical lines of laughing cats, geometrical line of laughing fish, cartoon art, abstract expressionism, geometrical lines of texts, violent brushwork, action painting art of kandinsky, art of CB Hoyo,

    cute little girl sitting on a big fluffy pet dinosaur with pale pink scales, watercolour animation

    Beautiful Japanese anime waifu, white wet-look hypertech bodysuit, indecent, flirty, Guweiz, scifi starship interier background, misty glowy airy scifi, rising light, Sony a6300 24mm f2.8

  • Man man, ab wann kann die die nette 35 jährige auch ausdrucken in 3D? Schon ist man bei Westworld [ag] [af]

    Spoiler anzeigen

    Client: Nvidia Shield 2019 Pro Kodi 20.1, AVR Sony STR-DN 1080, Nubert NuBox Series 5.1, LG TV 55SM8600 Nanocell
    Musik über Pi4 mit Picore 8 und LMS am AVR.
    Gästezimmer:Shield TV 2017 Kodi 20.1
    Server: unRaid; Fractal Des. Define 7;Asrock B365M PROF-4, Intel i3-8100, 16GB RAM und 20TB Platten,
    Arbeitstier: DeepSilence 4, AX370M, AMD Ryzen 5 2600X; 8GB RAM, Samsung M2 970EVO 500GB, RX560 Grafik

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!