offSight - DBSV

offSight - DBSV

bringt junge blinde und sehbehinderte Menschen up to date

Transkript

Zurück zur Episode

00:00:03: Offside Seminare.

00:00:05: Offside and online.

00:00:10: Hallo und willkommen zum fünften und letzten Modul unserer Seminarreihe!

00:00:13: Heute wird es nochmal richtig intensiv und kreativ, denn heute geht's ums Musikgenerieren, ums Videos- und Bildergenerieren , ums Podcastgenerieren Präsentationen erstellen Audioschnitt, Audiodeskription erstellen und noch einiges mehr.

00:00:28: Der folgende Vortrag ist über eine Stunde zwanzig lang und umfasst eben ganz viele verschiedene Themen und Tools.

00:00:34: Deshalb empfehle ich wieder unsere Kapitelmarken zu nutzen die es auf der Website gibt.

00:00:37: so kann man eben bestimmte Themen direkt anspringen oder auch schnell mal nachhören ohne dass man immer die ganze Episode abspielen muss.

00:00:44: Genug meiner Worte das Wort hat jetzt unser Referent Benjamin Hofer.

00:00:47: Wir gehen die Bereiche der Reihen nach durch und schauen uns im wesentlichen drei Dinge an was geht Wie ist die Bedienwirkheit und wo verbrauchen wir das eigentlich?

00:00:58: Bei allem, was wir uns heute anschauen geht es um Bild-und Ton.

00:01:01: Das Ganze nennt sich dann nicht Sprachmodell sondern Diffusionsmodell oder Diffusion Model muss man sich nicht merken, sondern einfach der Überbegriff dieser Modelle.

00:01:09: also genauso wie ChatGPT mit einem LLM arbeitet Also mit einem Large Language Model, mit dem großen Sprachmodell arbeiten die Tools, die wir uns Heute anschauen mit Diffusionsmodellen Und da kann man das Ganze anhand einer Bildgenervierung ganz gut erklären.

00:01:32: Das ganze funktioniert aber genauso mit Ton, ich stelle euch einen Rauschen vor, ein Bildrauschen oder ein Tonrausch aus dem Radio.

00:01:40: und aus diesem Rausche wird Schritt für Schritt anhand der Eingabe und dann des Promts und anhand dessen wie das Modell natürlich trainiert wurde also was die Modell beigebracht wurde.

00:01:54: Anhand des Rauschens wird dann Schritt für Schritt dieses Bild beziehungsweise der Ton erzeugt.

00:02:02: Das Rauschen wird also technisch gesehen Schritt-für-Schritt entfernt und nach vielen, vielen kleinen Durchgängen wird ein klares Bild daraus oder ein klarer Ton daraus.

00:02:17: Das ist mal was technischer Hintersteck ganz, ganz vereinfacht gesagt und vereinfachten erklärt weil die Vorgänge natürlich, wie immer ziemlich komplex sind.

00:02:32: Und wie immer ist es ein wehrstufiger Prozess.

00:02:36: Wie immer habe ich da definitiv auch noch andere Schritte, die da dran beteiligt sind.

00:02:45: Gerade wenn's dann um Video geht haben wir nicht nur Ton oder Bild, sondern beides eben im Video und das Ganze ist ziemlich komplex.

00:02:57: Was sich nicht ändert und was sich auch nie ändern wird, die KI arbeitet mit Wahrscheinlichkeiten.

00:03:03: Die KI ist anhand von riesengroßen Datenmengen trainiert sei es Musikstücke, sei es Podcasts, sei sie Bilder, seien es Videos... Die KI hat das alles gelesen gesehen in sich aufgenommen sozusagen technisch gesehen, konsumiert und das ist die Grundlage von jeder KI.

00:03:33: Die Grundlage für jede KI sind Daten.

00:03:35: Und diese Daten sind eben mit dem Fall Musikstückebilder usw.

00:03:42: Ja dann fangen wir in den ersten Punkt an.

00:03:46: ich bin jetzt auf der Plattform Suno und die Plattform suno wer das vielleicht kennt kann Musik generieren Ja.

00:04:59: Das ist einer dieser Songs über dieses KI Seminar natürlich.

00:05:08: Wie man das Ganze macht, wie man das generiert, schauen wir uns jetzt an.

00:05:12: Natürlich geht das Ganze mit verschiedenen Chores und mit verschiedenen Texten ganz unterschiedlich.

00:05:23: Hören auch noch ein zweites Beispiel.

00:05:27: So hört sich KI-generierte Musikern.

00:05:30: Es gibt mittlerweile auf Spotify ganze KI-Bands.

00:05:35: Also das sind keine Bands mehr mit wichtigen Sängern und mit richtigen Instrumenten, sondern das sind einfach KI-bands die... Das ist auch klar.

00:05:49: Transparenz gemacht, die einfach KI generiert, die Musik generieren und wo natürlich ein Mensch dahinter steht der das ganze führt, der das Ganze promptet.

00:06:05: Der die Anweisungen dazu gibt.

00:06:09: Zwei Werkzeuge möchte ich vorstellen.

00:06:11: Das eine ist Sono.

00:06:12: Das schauen wir uns gleich noch genauer an auch mit dem Screen wieder und das andere ist Google Gemini.

00:06:19: Google Geminy hatten wir im Modul drei oder Modul vier schon.

00:06:24: Ist auch ganz gut drin Chatbots zu bauen und kann eben auch Musik generieren.

00:06:30: Google Gemini ist da ein bisschen knausig, was die kostenlose Version angeht.

00:06:36: Eine kostenlosen Version konnte ich dann nur drei Sekunden generieren.

00:06:39: Das waren mir ein bisschen zu wenig.

00:06:41: Deswegen habe jetzt hier Suno genommen und Suno generiert auch immer gleich mehrere Beispiele wenn man einen Musikstück generiert.

00:06:52: Suno ist ein spezialisiertes Tool für KI-Musik.

00:07:00: Das Ganze funktioniert einfach so und man gibt einen Text ein.

00:07:03: Im einfachsten Fall wählt man Stil aus, man kann auch Stile auswählen.

00:07:09: Man kann natürlich auch Stiele ganz, ganz ausführlich eingeben wenn man ein Musikprofi ist was ich nicht bin.

00:07:17: Ich habe mir das alles irgendwie generieren lassen.

00:07:21: Ich bin absolut kein Musikprofi!

00:07:24: Ich bin auch keiner der irgendwelche Texte schreiben kann.

00:07:31: Das kann ich nicht.

00:07:32: Wenn man das kann, dann kann man da auch nicht nur den Stil angeben – den genauen Stil.

00:07:39: Also welche Instrumente sind da?

00:07:43: Wie hört sich der Gesang an männlich-weibliche Stimme?

00:07:48: Welches Genre möchten wir

00:07:53: usw.?

00:07:54: Und wir können auch den genauen Text angeben.

00:07:59: Wir können dem Text natürlich ganz zufällig von Sumo genervieren lassen.

00:08:04: Kann einfach schreiben, generviere mir eine Song über KI dann ist alles zufälich Dann ist der Stil zufählig und der Songtext ist auch zufältig.

00:08:14: wenn man da nichts stihltechnisch nix angibt dann ist es.

00:08:20: oftmals hört sich ein bisschen an in die Schlagerrichtung an was ich jetzt nicht so haben wollte.

00:08:29: Wenn man das haben will kann man das natürlich genauso machen.

00:08:34: Man kann auch Wacke generieren oder Hip-Hop, oder Metal oder was auch immer.

00:08:41: Die Texte und der Stil sind dabei Eingabefeldern und erwarten einfach wie bei der KI üblich einen Prompt also eine Anweisung.

00:08:50: Dem Ganzen sind keine Grenzen gesetzt.

00:08:53: Also einfach ausprobieren, um was die KI nimmt.

00:08:57: Die Bedienbarkeit mit ScreenWider ist gut.

00:09:01: Google Seminar kennen wir ja.

00:09:03: Da schreibt man wirklich einfach in das Eingabefeld rein, generiert mir einen Song.

00:09:07: Doppelpunkt Stil, was das Stil halt sein soll, Songtext, was man angeben will.

00:09:17: und dann generiert das Tool des Musikstück.

00:09:25: bei Gemini wie gesagt der Hinweis dass es in einer kostenlosen Version bei mir jetzt nur dreißig Sekunden generiert hat ist es dann anders.

00:09:39: Die Songs können natürlich auch heruntergeladen werden und bei den meisten Tools, das muss man prüfen sind die auch dann Eigentum des Nutzers, der Nutzer kann damit letztendlich tun was er will.

00:09:59: Auch da unterscheiden sich die Versionen und die Tools voneinander.

00:10:03: Da wäre die Bitte wenn jemand das wirklich in einem großen Größer, wenn kommerziellen Produkt oder Projekt nutzen will, müsste man die AGB prüfen ob man da zum Beispiel angeben muss von wem oder was das generiert wurde also von welchem Tool.

00:10:28: Ob man es im Zweifel gar nicht nehmen darf oder eben schon bei den meisten Tools wird es dann.

00:10:37: gerade in den kostenpflichtigen Versionen geht das Eigentum komplett an den Nutzer über, der es mit dem Tool erstellt hat.

00:10:47: Bedienbarkeit von Sono ist grundsätzlich auch ganz gut.

00:10:52: Die Oberfläche ist auf Englisch.

00:10:55: Ich muss mal wissen, wenn das Thema ist was für manche vielleicht spielwegig ist dann am liebsten lieber Champion einnutzen die Sono Oberflächen hat, Eingabefelder die auch beschriftet sind, hat auch die wesentlichen Buttons alle beschriftete und wir können sie ganz gut nutzen.

00:11:20: Die Anwendungsfälle sind eben ja ganz vielfältig von dem Ganzen.

00:11:27: man kann Chingles generieren tatsächlich in dem Fall es funktioniert ganz gut.

00:11:34: zu Anlass Songs wie bei einem Geburtstag oder so personalisierte Lieder die dann vielleicht auch ein bisschen lustig sind.

00:11:42: Auch da kann sich jeder austoben, der Kreativität sind da keine Gewänzen gesetzt weil wie ihr gehört habt hört sich das schon ganz gut an ist aber natürlich auch sehr stark von eurer Eingabe eben abhängig.

00:12:01: so dann bin ich hier auf Suno und wenn nicht mal ganz am Anfang hinspringen So, write some lyrics and leave blank for instrumental.

00:12:17: Also ich bin hier in dem erweiterten Modus schon.

00:12:20: In dem erweiterten Modus gibt es zwei Eingabefelder und ein paar Schalter die man eigentlich nicht wirklich braucht.

00:12:28: also man braucht nur die Eingabefelder.

00:12:34: der einfache Modus hat wirklich nur einen Eingarbefeld.

00:12:37: da kann ich dann einfach eingeben was ich will.

00:12:43: Erweiterte Modus hat den Vorteil, dass ich hier eben den Songtext und den Stil getrennt voneinander eingeben kann.

00:12:54: Und das auch getrennend voneinander verarbeitet wird.

00:12:56: Wenn ich jetzt hier hoch gehe habe ich die Auswahl zwischen beiden Versionen.

00:13:09: Genau!

00:13:09: Hier habe ich Advanced ausgewählt... Simplet Up Hier hätte ich noch Simpel, also einfach und fortgeschwitten.

00:13:17: In dem Fall!

00:13:18: Jetzt drücke ich wieder in E um in dieses Feld zu kommen und zeige euch ganz kurz um was da drin steht.

00:13:37: Jetzt ist das natürlich hier wieder alles Englisch weil auch die KI Ein bisschen besser Englisch versteht.

00:13:43: Auch bei der Musikgenerierung ist es so eigentlich üblich und da steht jetzt Intro, Spars Fingerpicked Akustikgitarre also einfach eine Akustikkitarbe.

00:13:57: soft pad war ich ja gut man könnt's jetzt anders schreiben dann wäre es vielleicht auch besser leer leer leer eckige Klammer auf verse ein eckigeklammer zu leer.

00:14:07: vor fünf Wochen war das Feld noch weit leer.

00:14:09: ein Wort wie Karidoppelpunkt Ein Wort aus fremder Zeit.

00:14:12: Leer, wir kamen rein mit Fragen im Gepäck!

00:14:14: Leer und sind heute da.

00:14:15: Gedankenstrich der Nebel ist weg.

00:14:17: So also hier steht wirklich dieser Text einfach drin Dieser Songtext Und er wird dann auch genauso übernommen.

00:14:24: Ich kann das jetzt auch zusammenfassen.

00:14:26: ich kann jetzt auch hier schreiten naja Generviere mir mal irgendwas zu dem und ihm wie immer Dann generiert er halt selber irgendwas.

00:14:34: Wenn ich jetzt hab Glück X-Pend Lyriks Box Schalter.

00:14:37: Dann kann ich hier noch Sachen auswählen Hänns Lyricks Runde Klamme auf.

00:14:45: Also hier noch Enhanced lyrics, also so ein bisschen die den Songtexten verändern durch KI wieder.

00:14:54: Das ist dann wieder ein Sprachmodell was da läuft und einfach diesen Songtext verändert.

00:15:00: wenn ich jetzt sage macht es ein bisschen spannender oder so weiter.

00:15:10: Thema Styles.

00:15:11: Genau da haben wir auch einen Eingabefeld.

00:15:13: Stammes Haus, Powercore Finisher Tango, Disco Tanz Das sind jetzt alles Vorschläge die das Tool da macht.

00:15:20: und Klont hat mir da einen Text geschrieben.

00:15:53: Das steht da drin, ziemlich genau wie der Stil sein soll.

00:16:01: Da kann ich natürlich jederzeit was ändern wenn Peppiger haben, ich muss ein bisschen Rockiger haben.

00:16:13: Da geht im Prinzip alles.

00:16:15: Man muss halt dann schauen was am Ende rauskommt und wie sich's anhört.

00:16:20: So jetzt haben wir wenn wird dieses Ding generieren.

00:16:26: Wir können damit B auf die Schalter gehen.

00:16:28: Dann können wir noch einige Styles hinzufügen auch interaktiv.

00:16:38: Wir mit ScreenItar tun uns gleich, dass sicherlich wenn wir das InDesigner-Welfeld eingeben.

00:16:45: Wir können aber auch da eben diese Buttons anklicken.

00:16:48: Wenn ich jetzt weiterspringe komme ich irgendwann zu einem Schalter der heißt Create Song und dann könnte ich das Ganze dann generieren.

00:16:57: Und dann habe ich eine Tabelle in die kann ich mit Terein springen.

00:17:04: Dann hab' ich schon den ersten Clip nennt sich das da Und da heißt bei mir eben fünf Wochenfeld, das ist der erste den ich hab.

00:17:14: Es werden standardmäßig bei Suno.

00:17:16: tatsächlich glaube ich vier oder fünf Musikstücke generiert nach dem Beispiel.

00:17:23: also es kann sich ja ganz anders anhören.

00:17:25: wenn wir jetzt zum Beispiel hier den ersten, den haben wir jetzt gehört teilweise Wenn wir jetzt kurz mal den zweiten anspielen hören wir dass sich das ganz anders anhört.

00:17:36: Das ist der zweite mit dem selben Prompt, mit derselben Eingabel.

00:17:41: Also ich ganz anders an.

00:18:09: natürlich selber Stil, selber Text, selber identischer Stil aber eben ein ganz anderes Musikstück, eine ganz andere Melodie.

00:18:21: weil was natürlich fehlt bei uns, bei unserem Prompt und unserer Anweisung sind die Noten.

00:18:27: So ein Musikstuck hat ja auch habe ich auch eine Melodie und die fehlen natürlich bei der Eingabe.

00:18:33: Was kommt jetzt raus, wenn ich das ganze mal... Sprachlos!

00:18:39: Wenn ich das Ganze einfach nur mit ganz wenig Eingaben mache, da hab' ich einen gehabt im Wochenende, der heißt Fünftes Modul und das Ganze kann sich dann so anhören zum Beispiel Lass mir jetzt mal dabei.

00:19:14: Also ganz anderes Stil, das ist tatsächlich dann eher so was man ein bisschen bekommen würde wenn man da keinen Stil nicht so richtig angibt.

00:19:28: Das ist das Thema Musik.

00:19:32: Musik-Generierung.

00:19:33: also ich empfehle da und für diejenigen die sich mit der englischen Oberfläche damit zurecht kommen, empfehles ich Suno.

00:19:40: Für alle anderen habe Wenn sonstige Anwendungsfälle gegeben sind, macht es ja vielleicht Sinn, sich da ein Abo zu wohnen.

00:19:58: Je nach Kontext, je nach Anwendungfall oder auch nicht die ersten dreißig Sekunden hat man dann und kann damit umprobieren und experimentieren.

00:20:12: Der nächste Bereich den ich vorstellen möchte ist das Thema Stimmen, Vorlesen und Voice Cloning.

00:20:20: Also Stimmen generieren und stimmende Klonen Wie wir alle wissen.

00:20:26: die Zeiten von roboterhaften Stimmen also von den roboter haften Screen wie der Stimmen sind auch längst vorbei.

00:20:34: also aktuelle KI-Stimmen Die klingeln extra twillig, die ist ein Ausdruck stark.

00:20:40: Wir haben oft die Situation Die wirklich guten KI-Stimmen von echten Sprechern kaum unterscheiden können.

00:20:52: Das ist manchmal verrückt, weil man gar nicht mehr weiß, kommt es jetzt von einer KI oder vom echten Menschen?

00:21:00: Und das ist natürlich auch faszinierend!

00:21:04: Eine Anwendung die wir da haben, ist Eleven Labs.

00:21:07: auf jeden Fall und wenn man über das Thema spricht muss man über Eleven Labs sprechen, das sind der Marktführer in dem Bereich.

00:21:15: Stimmen genervieren und mit Vorlesen, das können auch noch ganz viele andere Tools.

00:21:22: Es gibt diverse Stimmen von Google, von Microsoft, von Amazon.

00:21:26: Eleven Labs ist da nur ja einfach einer der Marktführer eines der ähnlichen Tools die wirklich auch viele, viele Stimmen anbieten und auch sehr, sehr echte Stimmen bieten.

00:21:41: Da gibt es vorgewertete Stimmen in vielen Sprachen Wie gesagt, es ja natürlich klingen.

00:21:49: Man kann eigene Texte vorlesen lassen.

00:21:52: Die Audio-Datei kann man dann auch runterladen und auch da gibt's natürlich wie es häufig ist eine kostenlose und kostenpflichtige Version die sich auch wieder unterscheidet.

00:22:04: Wie viel Text kann ich vorlesend lassen?

00:22:08: Wie lange kann das Audio sein?

00:22:11: Wie viele Stimmen kann ich nutzen den Funktionsumfang den ich nutzen kann

00:22:16: usw.?

00:22:18: Die Bedienbarkeit von der Elevenlabs Anwendung an sich, mit der ich einfach nur Texte vorlesen lasse und dann das Audio herunterladen ist gut.

00:22:31: Der etwas fortgeschrittener Editor den finde ich sehr schlecht bedienbar, er hakt mit einfach ja... Das ist sehr hakelig!

00:22:47: die Anwendung, in der ich dann auch die Stimme klonen würde.

00:22:51: Also ich kann Eleven Labs sogar beibringen sozusagen mit meiner eigenen Stimme vorzulesen indem mich einfach eine Audio Datei, an der ich fünf Minuten irgendwas vorlese oder jetzt dieses KI Seminar halt da hochlad und dann Eleven Labs beibringe diese Stimme zu Klonen.

00:23:20: Das dauert dann ein paar Minuten und dann kann ich tatsächlich auch meine Stimme nutzen, meine eigene Stimme um da irgendwas vorzulesen.

00:23:30: Um irgendetwas anderes vorzulesen und Eckstein zu geben.

00:23:34: Ein ganzes Buch reinzugeben natürlich nur in der kostenpflichtigen Version und mit meiner eigenen Stimme was volllesen zu lassen.

00:23:44: Das Ganze kann man nutzen für Podcasts, Generierung, Videos Wenn man Videos mit Ton versehen will und so weiter, das ist auch wieder keine Grenzen gesetzt.

00:24:03: Außer natürlich den rechtlichen.

00:24:05: Ich darf nicht irgendjemandes Stimme daneben klonen.

00:24:11: Das ist verboten aus gutem Grund und auch Inhalte die wir mit KI genervieren.

00:24:18: Und es ist auch dem Fall relevant müssen wir kennzeichnen.

00:24:24: in den meisten Fällen.

00:24:26: Das schreibt die EU vor, also in der EU gibt es einen AI-Act, nennt sich das ein KI-Gesetz und das schreibt vor dass wir Dinge, die mit KI generieren auch als solche kennzeichnend müssen.

00:24:43: Der eine oder andere hat es vielleicht schon mal gehört bei Hörfilmen, bei Netflix zum Beispiel und mittlerweile auch um ZDF sind solche KI-Stimmen ja längst im Einsatz.

00:24:56: Wenn ich einen Hörfilm mehr anschaue, Dokumentation oder sowas, dann ist das häufig der Fall, dass am Ende eben genannt wird diese Hörfilmpfassung wurde mit einer künstlich generierten Stimme erzeugt.

00:25:19: Also Eleven Labs, der Editor, die Stimme Das Erzeugen und das Abspielen erreicht es.

00:25:28: Alles andere ist ein bisschen mühsamer.

00:25:31: auf Apple habe ich nicht getestet, Ich hab mit Windows und NVIDIA getestete was sehr faszinierend auch bei den Werkzeuge mit denen wir Stimmen generieren können und eigene Stimmen klonen können.

00:25:51: Es gibt auch die Funktion Voice Dabbling Also sprich, eine Stimme auf Deutsch gesagt.

00:26:01: Eine Stimme nicht nur zu klonen und dann spreche ich mit meiner eigenen Stimme irgendwas anderes.

00:26:07: Sondern ich spreche mit meiner eigener Stimme nichts Deutsch sondern irgendeine andere Sprache.

00:26:14: Auch das klingt erstaunlich echt.

00:26:16: also Ich kann meine Stimme klonen Und kann dann mit meiner Stimme sozusagen Englisch Französisch-Kinesisch sprechen.

00:26:28: Ja, wenn der Text in englisch-französisch oder chinesisch Gutes, grammatikalisch Gudes von der Wortwahl her Gutes wird es ein Muttersprachler nicht stark merken.

00:26:43: Dass ich diese Sprache gar nicht kann sondern dass das halt KI generiert ist.

00:26:48: Es hört sich manchmal etwas zu gut und gut und oder geschliffen an.

00:26:55: Das hört sich manch mal etwas Je nach Werkzeug, das man da verwendet, manchmal etwas abgehakt an.

00:27:02: Es funktioniert wirklich aber erstaunlich gut und das Ganze geht sogar soweit, dass es Anwendungen gibt die das ganze live machen.

00:27:11: Das heißt ich habe nicht vorher... Ich generiere nicht vorher den Text oder lebe mich vorher den text ein und lasse ihn dann mit der Stimme sprechen sondern ich bin in einer Konferenz.

00:27:23: der eine spricht nur Englisch, andere spricht nur Deutsch Und ich kann dann wirklich eine Funktion nutzen, die dem einen das Ganze in Englisch übersetzt und dem anderen in Deutsch.

00:27:37: Also eben Muttersprachler, eben in seiner Sprache.

00:27:42: Die Funktion gibt es bei Google Meet.

00:27:44: also wir sind hier im Zoom Wir können's nicht testen aber Google Meet wenn man die Vollversion hat von Google Meet geht das tatsächlich.

00:27:54: Ich habe das auch schon ausprobiert.

00:27:56: Es nimmt dann wirklich meine Stimme und legt sozusagen wie bei einer Übersetzung, wie wenn jetzt im Fernsehen oder Radio jemand übersetzt.

00:28:07: Legt dann die übersetzte Version etwas lauter eben über die andere.

00:28:16: also dass man schon im Hintergrund noch ganz leise hört das es eben übersetzt wurde, dass es gedolmetscht wurde aber darüber liegt eben die gedolmetzte Spur.

00:28:31: Das hört sich erstaunlich echt an.

00:28:34: Was sind jetzt Anwendungsfälle allgemein von sowas oder Hauptanwängungsfällen?

00:28:40: Wofür brauchen wir das?

00:28:42: Ich habe ja gesagt, wir schauen uns auch immer an, wofür wir es brauchen.

00:28:46: Naja meine Dwegen, wir nehmen einen Vortrag in unsere Muttersprache auf und wollen ihn aber doch irgendwie auf Spanisch übersetzen weil... keine Ahnung!

00:28:58: Der spanische Blinden-und Sehbendertenverband, dass auch gut fängt Was wir machen, der Aufwand von dem Ganzen ist riesengewos.

00:29:10: Mit KI wäre das im vertretbaren Bereich denke ich und die Stimme bleibt dann tatsächlich wenn derjenige einwilligt, die gleiche oder benutzen eine Stimme die schon gibt, die auch sehr gut und natürlich klingen.

00:29:33: Und wir nutzen Eleven Labs als Beispiel natürlich nur.

00:29:42: Da habe ich jetzt auch hier Eleven Labs schon offen, das war dann mein NVDA der wieder hier schon ins Eingabefeld gehüpft ist.

00:29:52: wie gesagt die einfache Oberfläche von Eleven Labs ist einfach bedienbar und da haben wir im Prinzip ein Eingabelfeld den Elementen, die wir wirklich brauchen.

00:30:05: Haben wir ein Eingabefeld, ein paar Auswahlfelder und einen Schalter mit dem wir das Ganze starten können.

00:30:17: Und dann können wir uns auch gleich anhören.

00:30:21: Wenn man in Levelnaps das erste Mal startet muss man sich anmelden.

00:30:27: Das ganze kann mit einem Google Account passieren wahrscheinlich auch Microsoft oder natürlich auch mit der e-mail Adresse.

00:30:35: Apple dürfte auch gehen.

00:30:38: Und wenn wir jetzt dann wieder an Anfang hinspringen.

00:30:41: Sprachmodus sprechen und dann wieder das E-Debütten.

00:30:54: So, steht jetzt schon ein Text drin.

00:30:56: Das Eingabefeld ist auch ordentlich beschriftet.

00:30:59: halt in dem Fall wieder nur auf Englisch.

00:31:01: Es steht Enter your text hier.

00:31:05: also geben Sie den Text hier ein.

00:31:26: Im Alpenland Eldoria, wo der Himmel schimmerte und die.

00:31:29: Weltergeheimnisse zum Wind flüsterten lebte ein Drache namens C. Fyros.

00:31:33: Eckige Klammer auf Sarcastically eckige Klama zu.

00:31:35: nicht der Typ, der alles niederbrennt Eckige Klammer auf die Gläseckige klammer zu, sondern sanft und weise mit Augen.

00:31:41: Wie alte Sterne!

00:31:42: Eckige Krammer auf Wiesbärs.

00:31:43: eckige Klammer zu.

00:31:43: selbst Die Vögel

00:31:44: verstunden.".

00:31:46: Ja das ist jetzt einfach ein irgendein Fantasy Text, irgendeinen Beispieltext den die halt immer schon vorgegeben haben.

00:31:58: wir können da jetzt auch alles andere bei Reinkopieren.

00:32:01: worauf ich jetzt eigentlich hinaus will is diese sogenannten tags die damit drinstehen.

00:32:09: Deiner oder Anderer hat es vielleicht gehört.

00:32:11: Ein paar Jahre hat den Text vorgelesen, aber immer wieder so komische Wörter, englische Wärter mitten reingesprochen.

00:32:20: Und die stehen auch wirklich da... Das sind Tags, also sogenannte Schlüsselwörter der KI quasi sagen wie sie sprechen soll.

00:32:34: Also ein Sprecher spricht ja nicht nur den Satz sondern Da kommt sie auch ganz stark auf den Thronfall an, wie er spricht.

00:32:45: Und da gibt es eben diese Schlüsselwörter die da ganz interessant sind und die man da auch verwenden kann.

00:32:57: So zum Beispiel Sarkastically nicht der Typ, der alles niederbrennt.

00:33:02: also hier wird sozusagen die KI angeleitet Diese Stimme eben, ja so ein bisschen sarkastisch klingen zu lassen.

00:33:18: Giggles ist dann ein weiterer Tag oder eben Wispers selbst die Vögel verstummten also Wispas alles was halt zu dem Text passt dass der Text eben auch ordentlich vorgelesen wird.

00:33:34: Wenn wir jetzt hier weiterspielen da habe ich jetzt noch Deutsch eingestellt die kann man beliebig umstellen.

00:33:43: Der Text wird dann auch in der anderen Sprache natürlich übersetzt.

00:33:47: Standardmäßig, wenn man das zum ersten Mal öffnet, steht es auf Englisch.

00:33:52: Man kann aber hier auch German einfach einstellen, dass Eingabefeldes auch gut bedienbar ist.

00:33:58: Jetzt haben wir ja auch schon die Stimmen.

00:34:02: Hier haben wir jetzt zwanzig Stimmen zur Auswahl mittlerweile auf Deutsch.

00:34:05: Das ist ordentlich!

00:34:08: Keine Ahnung was da kann, das ist wahrscheinlich eine allgemeine Stimme.

00:34:11: Leon Sternrich enttiebt nicht ausgewählt, zwei von zwanzig.

00:34:14: Leon werbe jetzt rich and deep?

00:34:17: Christian warment catavating nicht aus gewählt drei von zwantzig.

00:34:20: Ähm... Christian is warm-and-cat captivating.

00:34:24: also da steht immer wie diese Stimme ob sie warm klingt oder weich oder... Leon Sternricht enttied nicht ausgefählt, Chris Leonieklier entengaging nicht aus Gewählt vier von zwundzwanzig.

00:34:35: Ja, Leonie, die Klinema mal würde ich sagen.

00:34:38: Hauptstrommarke Leonie Reusmenü-Schaltfläche eingeklappt Liste öffnen.

00:34:41: Das haben wir hier die Leonie genommen und dann müssen wir eigentlich nur noch auf Play drücken und ein bisschen warten.

00:34:48: das dauert dann ein bisschen.

00:34:49: generiert wird.

00:34:52: Im alten Land Eldoria wo der Himmel schimmerte und die Wälder der Heimnisse zum Wind flüsterten lebte einen Dracher namens C-Führers nicht der Typ der alles nieder brennt sondern sanft und weise mit Augen wie alte Sterne.

00:35:06: Selbst die Vögel verstummten, wenn er vorbeiging... Was war's?

00:35:11: Und wir hören jetzt auch schon diese Tags ein bisschen raus aus dem ganzen... Weil wenn ich jetzt einmal mal hier... Und dann mal diese Texte rausnehmen.

00:35:28: Also nicht der Typ, der alles niederbrannt.

00:35:30: Das war jetzt der Tag und so lange ging ja auch.

00:35:33: dabei weiß ich jetzt nicht ob man die Texte auf Deutsch formulieren könnte.

00:35:38: Also ich... Leerzeichen S. Eleven Labs interpretiert da alles, was in den äckigen Klammern steht?

00:35:45: Wie gut allerdings Tags auf Deutsch interpretiert werden weiß ich nicht!

00:35:49: Eckegeklammer auf Wiesbärseckige Klammer zu selbst die Vögel-Eckige-Klammer aus GWHI.

00:35:52: Wenn nehmen wir jetzt auch Mispas raus.

00:35:55: Ja, S. Eck leert es.

00:35:56: Die Vögel verstunden wenn er vorbeiging'.

00:35:58: Die Vögels stunden wenn der von German Language mit Leonie Voice Menü Schaltfläche eingeklappt Liste öffnen.

00:36:03: Na ja, die Leonie, naja die Leon lasst mir mal weil die haben wir... Plänschalter Die kennen wir schon Nicht verfügbar.

00:36:10: Im alten Land Eldoria, wo der Himmel schimmerte und die Wälder der Heimnisse zum Wind flüsterten, lebte ein Drachen namens C-Führers – nicht der Typ, der alles niederbrennt sondern sanft und weise mit Augen wie alte Sterne.

00:36:24: Selbst die Vögel verstunnten wenn er vorbeiging.

00:36:27: Ja also man hat das ganz klar gehört.

00:36:30: auch die Betonung von dem normalen war natürlich super aber Wir haben ganz klar gehört, diese Text bringen was.

00:36:41: Diese Schlüsselwörter bringen etwas.

00:36:43: Die führen einfach die KI ein bisschen sagen der KI wie sie machen soll, wie sie es betonen sollen.

00:36:55: Was ist jetzt wenn wir da was anders eingeben?

00:36:59: Das war jetzt der Text von Eleven Labs.

00:37:00: ja schön und gut dass er vorgelesen wird das glaube ich auch.

00:37:06: aber wie wird jetzt irgendwas vorgelessen?

00:37:10: Kann ja einfach mal ein paar Seilen vom Hand-Out.

00:37:15: Einfach mal da rein kopieren, weil, sagen wir ja eh alles im Vorgang stehen und dann kommen wir auch somit gleich zum nächsten Thema.

00:37:25: So ich hab das Ganze jetzt kopiert.

00:37:27: Sprachmodus sprechen Geh wieder zurück auf die Sparhausgabe und Enter your Text.

00:37:31: hier Im alten Land Eldoria Wo der Himmel schmatt Stria und entfernen Ich weiß es ganz einmal raus Videos in andere Sprachen.

00:37:43: Lehr, erklär Videos oder Vorträgen reicht es allemal.

00:37:48: So also dieses Eingabefeld ist jetzt auch begrenzt.

00:37:50: Also wir können da nicht einen Roman eingeben aber für so ein paar teilen Texts das ist super.

00:37:56: Für alles andere müssten wir dann in den anderen Editor gehen beziehungsweise die Schnittstelle nutzen.

00:38:07: Es gibt eine App die nennt sich Eleven Reader.

00:38:10: Das ist vielleicht da noch sehr interessant, weil diese Elevent Reader App, die ist auf dem iPhone auch ganz gut bedienbar für uns.

00:38:21: Und da können wir dasselbe tun eben mit unseren Dokumenten, also mit unserem PDF-Dokumenten und mit unseren Büchern, mit allen Dokumentinnen, die wir halt so haben auf unserem iPhone.

00:38:38: Da eine Stimme auswählen und uns die vorlesen lassen Und... Und dann drückt man wieder Play.

00:39:03: Ist ein bisschen länger dauern wahrscheinlich, weil das ein bisschen mehr Text... Eine Sonderfunktion, die Eleven Labs gut beherrscht – Voice Dubbing.

00:39:15: Du gibst ein Video oder eine Audio-Datei rein, Eleven Labs Trendsprecher von Hintergrundgeräuschen übersetzt das Gesagte in einer andere Sprache und legt es mit der Originalstimme drüber.

00:39:28: Mehr als dreißig Sprachen werden inzwischen unterstützt.

00:39:31: Für uns ist interessant, dass funktioniert in beide Richtungen!

00:39:36: Du kannst englischsprachige YouTube Tutorials auf Deutsch synchronisieren lassen oder eigene Inhalte international zugänglich machen.

00:39:45: Litensynk ist nicht perfekt, aber bei Erklärvideos oder Vorträgen reicht es allemal.

00:39:53: Ja das ist auch schönes nächste Thema.

00:39:55: Das nächste Thema geht nämlich in die Richtung Videogenerwierung und da bietet Eleven Labs aber nicht nur Eleven Labs sondern auch andere Tools mittlerweile die Möglichkeit dass wir ein Video reingeben die Hintergrundgewäusche von dem ganzen, von den anderen Trennen und was wir dann eben dieses Voice-Tubbing nutzen.

00:40:19: Also sprecht das Video wirklich eins zu eins in die andere Sprache übersetzen.

00:40:26: Meines Weges haben jetzt Erklärvideos und möchten sie mehr.

00:40:30: wenn Sprachen anbieten ist es ganz gut oder wenn wir YouTube nutzen haben wir das zum Teil mittlerweile auch schon in Youtube drin.

00:40:41: Wenn wir jetzt einen englischen YouTube-Kanal nutzen, können wir Videos teilweise schon auf Deutsch uns anschauen.

00:40:52: Das Ganze was da genutzt wird ist nicht voice dubbing in dem Sinne das die Stimme des Sprechers genutst wird und die Stimme des Speichers eben auf Deutsch spricht also desjenigen Sprecher der das Video einspricht sondern wird schon noch eine synthetische Stimme genutzt, also eine Stimme von Google.

00:41:15: Die hört sich auch nicht ganz so echt an wie jetzt das hier.

00:41:20: aber wir haben jetzt eben die Möglichkeit weil wir jetzt nicht so gut Englisch sprechen oder das Ganze in der anderen Sprache ist, die wir gar nicht können die Übersetzung zu nutzen und es klappt auch bei YouTube schon erstaunlich gut.

00:41:41: Also die Üversetzung an sich ist gut.

00:41:44: Die Stimme ist noch ein bisschen gewöhnungsbedürftig, weil es eben nicht die der Sprecher ist sondern halt irgendeine synthetische Google-Stimme.

00:41:54: Im Handout habe ich jetzt hier noch Whisper mit drin als weiteres Tool einfach ums in dem Kontext nochmal zu nennen.

00:42:04: wir hatten das ja im einen und der letzten Module schon, Module drei war's als wir über die lokale KI gesprochen haben.

00:42:14: Also natürlich Texttranskription ist dann eben auch über Whisper möglich und Whisper wird in dem Zusammenhang natürlich ganz viel genutzt, um Audio erstmal im Text umzuwandeln.

00:42:30: Und mit dem Text weiter zu arbeiten, den Text übersetzen und dann wieder ein Audio in so eine Sprachausgabe umzuwandeln und mit einer Stimme vorzulesen.

00:42:51: Es ist ganz selten so, dass so K-I-Modelle alles können... Also es gibt Omnimodelle, sogenannte Omnibodelle.

00:42:58: die können alles.

00:43:00: also da ist das dann tatsächlich nicht so, damit ich erst mal sowas wie Whisper nutze um das zu transkribieren was ich sage und dann wieder als Text eben zu übersetzen und dann irgendwie auszugeben sondern da ist es dann so, allem trainiert wurde und Texte, Bilder Videos Musik und Sprache oder gesprochene Sprache versteht und nach ausgeben kann direkt ohne Zwischenschritte.

00:43:36: Das gibt es auch.

00:43:37: das ist zum Beispiel bei dem ChatGPT Voice Motor Fall.

00:43:41: aber wenn ihr die Sprachmusen nutzt von Google oder von ChatGPD dann ist es da so.

00:43:49: Das ist aber immer noch ungenauer als überall einfach dieses Spezialstools zu nutzen.

00:43:59: Und das nächste, was ich hier vorstellen möchte, ist Notebook LM.

00:44:07: Notebook LLM ist ein Tool für Google, was wunderbar passt in den Kontext.

00:44:14: Es bietet im Wesentlichen drei Dinge die bei uns in dem Fall nützlich sind.

00:44:23: Bei Notebook LNM ist es so, dass man immer eine Wissensbasis hoch lädt.

00:44:29: Es können PDF sein, es können Webseiten sein, das können YouTube-Videos sein.

00:44:35: Das können eigene Notizen sein und das können Texte sein.

00:44:38: Also Notebook LM versteht wirklich von TXT über Docs, also Word-Dokumente über EPUBs, über PDFs alle an Dateivamate Liest Notebook LM diese Quellen und antwortet ausschließlich auf Basis dieser Quellen.

00:44:59: So gut so bekannt, kann man jetzt sagen ja das macht doch eigentlich dieser Chatbot den wir im letzten Modul erstellt haben auch.

00:45:09: notebooklm als Tool geht dann noch einen Schritt weiter denn da kann man wirklich effektiv und umfassend Werkzeuge nutzen also Recherche, Fragen stellen natürlich.

00:45:24: Man kann aber auch eine sogenannte Audio-Zusammenfassung generieren und eine Audiozusammenfassung hört sich an wie ein Podcast mit zwei Sprechern.

00:45:34: Es sind auch immer die zwei selben Sprecher.

00:45:38: das geht in unterschiedlichen Sprachen.

00:45:41: In der Vollversion kann man da sogar reingrätschen Und dann mit den Sprechanen also die die Sprechaer so bisschen leiten anleiten was sie erzählen sollen.

00:45:53: Man kann vorher angeben, wie denn der Podcast aufgebaut werden soll und so weiter.

00:46:00: Man kann sich aber auch währenddessen verbinden und über das Mikro dann was sagen, Rückfragen stellen oder so... Und der Podcast wird eben anhand der Quellen generiert.

00:46:15: Also zwei KI-Sprecher unterhalten sich wirklich locker und auch fundiert über diese Quellen, über die Sinnhalte.

00:46:22: Das klingt erstaunlich!

00:46:24: natürlich.

00:46:26: Ursprünglich ist das ganze Tool, die ganze Anwendung dafür geschaffen worden um Leuten die Möglichkeit zu geben etwas zu lernen also auch ausführliche Quellen hochzuladen in dem Format indem sie es am besten verstehen, indem Sie es am Besten konsumieren können.

00:46:52: Also angenommen ich habe jetzt super Komplexe PDF-Dokumente oder Finanzbericht, dann ließ sich das ja erstmal vielleicht ein bisschen langweilig.

00:47:06: Für manche vielleicht auch gar nicht unbedingt gut verständlich.

00:47:10: und dann ist Notebook LM eben einen Tool in dem zum einen nicht nur eine Quelle oder zwei hochgeladen werden können sondern ganz viele zum selben Thema.

00:47:21: mittlerweile kann man auch das Tool selber recherchieren lassen wie das sich dann an, wenn ich halt keine eigenen Quellen habe.

00:47:29: Sondern eben halt nur zu einem bestimmten Thema.

00:47:33: was wissen will mich so einen bestimmten thema aufschlauen will zum beispiel zu KI und kann nicht sagen recherchieren wir da mal ein paar quellen ein paar videos ein paar Dokumente ein paar webseiten.

00:47:49: Ich empfehle das schon selber zu tun also selber dort Quellen hochzuladen Denn dann weiß man zum einen, was man hochgeladen hat.

00:47:58: Zum anderen vermeidet man auch diese... ganz vermeiden kann man es nie, aber minimiert man auch Halluzinationen und man weiß dann eben, was was man noch geladen hat.

00:48:14: Man kann natürlich Fragen stellen, man kann eigene Notizen hinterlegen.

00:48:18: Was auch geht mittlerweile ist eine Video-Zusammenfassung oder Video-Overview.

00:48:24: Das geht erst seit kürzlich.

00:48:26: Das ganze bietet eben auch ein Videomodus für die meisten von uns jetzt wahrscheinlich eher weniger interessant.

00:48:34: Da wird das ganze Thema, was man da hochgeladen hat noch mal in einer Video-Präsentation dargestellt mit einer Folienpräsentation wie es so ein bisschen PowerPointartig und auch mit einem gesprochenen Kommentar Generviert von VO-Drei, VO heißt das Modell von Google, von Google Gemini was eben diese Videos generiert.

00:49:05: Für uns ist es relevant längere Texte PDFs anhören statt durchlesen.

00:49:10: also man kann sich wirklich einen Podcast dazu anhören zu dem was man da hochgeladen hat natürlich immer aufpassen.

00:49:17: auch da kann mal etwas dabei sein was irgendwie verdreht wird oder was eben die KI nicht ganz sauber aus den Quellen extrahiert.

00:49:28: Also, wenn man sich mit der Thematik auskennt und halt nur irgendwie was dazulernen will, merkt man das vielleicht?

00:49:36: Wenn man ganz etwas Neues lernt sollte man sich sicherlich nicht nur auf das spützen.

00:49:43: also das ist ein Werkzeug mehr was wir nutzen können.

00:49:50: es ist aber trotzdem Nur ein Werkzeug, nur eine KI.

00:49:54: Sie basiert immer noch auf Wahrscheinlichkeiten und auch wenn da diese Quellen eben dahinterstecken es ist immer noch so dass das teilweise komplexe Themen sind, dass es teilweise mehrere Quellen sind und die KI endiert dazu zu hallucinieren oder halt Dinge nicht ganz in den wichtigen Kontext zu setzen Auch in diesem Podcast zusammenfassend.

00:50:24: Ich finde beim Lernen oder sowas funktioniert das super gut, weil es eben eine total andere Möglichkeit ist wie man eben Informationen aufnimmt.

00:50:35: Also ich sitze nicht von meinem Wechner und lese da irgendwas mit meinem Screen wieder und les mir dieses PDF durch was vielleicht kompliziert ist.

00:50:45: Das mache ich vielleicht auch aber ich kann auch eben mir so einen Podcast generieren lassen und diesen Podcast mal mir anhören.

00:50:56: Was man mit Melfed macht, man macht Notebook LM auf das habe ich auch in dem Handout als in der Linkliste drin so notebooklm.google.com.

00:51:07: Das Tool ist vollständig auf Deutsch bedienbar und Ich gehe da mit meinem Google Account natürlich rein wie es bei den Google Tools so üblich ist Gehe auf neues Notebook Und kann dem Ganzen wie das bei einem Dokument oder sowas übliches Namen geben.

00:51:27: Ich habe da jetzt natürlich eins erstellt über den KI-Podcast, nicht nur mit dem Podcast sondern auch über denKI Workshop hier und das KI Seminar hier und hab dann meine ganzen Handouts alle hochgeladen.

00:51:43: Das habe ich jetzt in dem Fall gemacht als Datei Upload weil ich die ganzen Handout nicht nur im Forum hab, sondern auch als Dokumente bei mir auf der Festplatte.

00:51:56: Hab dann nochmal den Forum Thread auch verlinkt.

00:52:01: Also man kann auswählen zwischen Webseiten und Dateien die man da hoch lädt oder auch YouTube Videos Und dann gibt mir Notebook LM erstmal eine Zusammenfassung und ich kann dann weitere Fragen stellen Kann eben mein Quiz generieren meine Karteikarten Und so weiter.

00:52:24: Unten, eine der letzten Überschriften auf der Seite ist dann das Studio und in dem kann ich die Audio- und Videozusammenfassungen generieren.

00:52:36: Ich kann auch mehrere Audiotasammenfassung generieren und in der Pro-Version kann ich diese Audiodesammenfassung auch steuern indem ich da wieder einen Promt eingebe.

00:52:49: also eine Anweisung wie soll die Audio-Zusammenfassung sein, auf was soll sie sich stützen?

00:52:56: Was soll diese Podcastfolge genau behandeln.

00:53:01: Was soll sie nicht behandeln?

00:53:02: Je mehr das du besser oder je mehr desto genauer wird so wie ich mir es vorstelle.

00:53:11: Ich habe es jetzt einfach gemacht in der kostenlosen Version anhand der Quellen ohne einen zusätzlichen Prompt und ich würde sagen wir hören uns jetzt einfach mal an.

00:53:22: Also stell dir mal vor, du stehst in einem komplett dunklen Raum.

00:53:26: Du tastst es dich so vorwärts, hoffst einfach dass du nicht gleich über den Tisch stolperst.

00:53:30: und wenn du dann auf diesem Tisch ein Buch findest also früher wäre das für dich einfach nur einen Stummergegenstand gewesen Ja!

00:53:38: Ein Objekt, das dir halt gar keine Informationen gibt Genau.

00:53:41: Aber was wäre?

00:53:42: Wenn dir da plötzlich eine leise Stimme im Ohr nicht nur exakt sagt Hey, da steht der Tisch.

00:53:48: Sondern die dir auch den Titel von diesem Buch vorliest, dir das Cover bis ins kleinste Detail beschreibt und... Und das ist der Wahnsinn!

00:53:55: Der direkt die Kernthesen vom ersten Kapitel zusammenfasst.

00:53:58: Und das is keine Science-Fiction mehr?

00:54:00: Absolut nicht.

00:54:01: Genau dieses Szenario liegt heute hier quasi vor uns auf dem Tisch.

00:54:04: Wir haben nämlich – und dass es super spannend – einen riesigen Stapel an Workshopmaterialien bekommen.

00:54:10: Richtig aus dem Projekt Offside.

00:54:12: Genau vom deutschen blinden und sehbehinderten Verband Die Module eins bis fünf.

00:54:18: Und das Verrückte daran ist, diese ganzen Unterlagen stammen aus dem Jahr zwetausend sechsundzwanzig?

00:54:24: Ja wir tauchen da heute echt tief ein!

00:54:27: Denn diese Dokumente zeigen uns... Also sie zeigen uns vor allem dass KI halt keine Spielerei mehr isst ne Sondern ein absolut unverzichtbares richtig handelndes Hilfsmittel für blinde und sehbehinderte Menschen.

00:54:38: Definitiv Das ist ein echter technologischer Paradigmenwechsel, den wir hier in den Quellen sehen.

00:54:44: Es ist dieser Übergang von passiven Text-Chatbots zu wirklich agentischer Software.

00:54:51: Agentisch?

00:54:52: Also... Das heißt die Systeme reden nicht einfach nur mit dir, sie handeln!

00:54:56: Die surfen komplett selbstständig im Netz, die scannen physische Umgebungen über Kameras und Sie werden sogar kreativ.

00:55:03: So ich stoppe jetzt wieder das reicht So hört sich das an.

00:55:09: Man merkt schon, dass das keine echten Sprecher sind finde ich.

00:55:14: also die Stimmen hören sich natürlich erstaunlich echt an.

00:55:17: aber wie die miteinander reden anhand der Art und Weise merken wir uns schon, da ist das KI so nicht eine echte Spreche.

00:55:26: Aber wie ihr merkt es hört sich schon gut an und es funktioniert.

00:55:32: bei Notburglämme ist tatsächlich auch so dass man diese generierten Zusammenfassungen verwenden darf.

00:55:40: Ich kenne einen Podcast, der tatsächlich so generiert ist.

00:55:45: Also ein Podcast, da geht es auch um KI, bisschen um die KI in der Arbeitswelt und das ist tatsächlich ein Podcast mit solchen Quellen gefüttert Und das sitzt aber keiner im Studio und keiner vom Mikrofon und spricht sein, sondern das ist halt eben über Notebook-LM generiert, heruntergeladen.

00:56:11: Und als Podcast Folge eröffentlicht!

00:56:14: Wir können uns jetzt ganz kurz dieses Tun noch anschauen und schauen wie es so aussieht.

00:56:21: So wir sind jetzt ganz am Anfang und da haben wir erstmal also die Google Apps.

00:56:34: Das habe ich jetzt, das ist mein Titel dieses Notebooks.

00:56:39: Hier könnte ich ein neues Notebook erstellen.

00:56:42: Das will ich aktuell nicht.

00:56:45: Das Notebook kann ich auch teilen.

00:56:49: Das werde ich noch tun.

00:56:50: Ich werde das Notebook einfach im Vorraum teilen und dann bekommt jeder sozusagen eine Ansicht, mit der er dann auch selber seine Audio-Zusammenfassungen weitergehen erwähnt kann.

00:57:02: Und ich kann noch hier ein bisschen Einstellungen ändern und so weiter.

00:57:08: Wichtig ist jetzt hier das sind die Quellen.

00:57:10: Quellen können wir hinzufügen?

00:57:16: Wir können im Web nach neuen Quellen suchen wenn wir keine Quellen haben Recherchieren lassen wollen.

00:57:25: Menü-Schaltfläche eingeklappt unter menü schnelle Recherche.

00:57:28: Hier können wir noch ein bisschen die Recherchen steuern, woher recherchieren soll, ob er genau recherchiert oder schnell.

00:57:33: Kontrollfeld aktiviert alle Quellen auswählen.

00:57:36: So hier können wir jetzt bestimmte Quellen auch nur auswälen und wir sehen eben auch welche Quellen wir hochgeladen haben.

00:57:42: Modul eins Unterstrich was ist kd.md Schalter?

00:57:46: Ich habe mal module eins.

00:57:47: was ist KI usw.

00:57:49: Chat Überschrift Ebene zwei.

00:57:51: Da sind wir dann schon beim Chat Und der Chat funktioniert im Endeffekt wie bei einem Chatbot.

00:58:02: Und hier habe ich noch mal einzelne Fragen, die werden mir auch schon generiert.

00:58:07: also wenn ich jetzt hier draufklicken würde... Dann kriegen wir leider kein Feedback vom Screen wieder sondern wir müssen dann müssen wir nochmal weiterspringen Wie sicher sind meine Daten bei der Nutzung von Kardisch?

00:58:23: zentrale Risiken bei US-Anbietern?

00:58:25: Überschriftebene drei?

00:58:26: Ja, dann haben wir hier alle Chatnachrichten.

00:58:28: Alle Fragen, die ich bisher schon angeklickt habe drin... Gib mir einen guten Prompt für einen Guten!

00:58:34: So und hier hab' ich dann zum Beispiel mit diesem Song gearbeitet.

00:58:37: also als Beispiel habe ich am Wochenende einfach gesagt gut jetzt da steckt ja ein LLM dahinter.

00:58:44: Jetzt gibt mir meinen guten Promt für den guten lustigen Song über diese über diese bergschub bei.

00:58:50: also man kann natürlich auch jederzeit diese tools kombinieren und dem jetzt hier sagen, dann gibt mir doch mal einen guten prompt für diesen song eine gute anweisung.

00:59:00: Und dann verfeine ich das selber noch und gebe es dann gibts dann ansono.

00:59:07: Also auch dass das geht.

00:59:08: natürlich wenn ich jetzt ein e druck eingabe fällt mehr zeilig frage stellen oder etwas erstellen.

00:59:14: Dann kann ich ja natürlich wieder eine fragestellen irgendwas anders erstellen.

00:59:21: Ganz unten habe ich dann eben das Studium auf einer Überschrift.

00:59:28: Ebene zwei Schalter-Audio Zusammenfassung Genau, da bin ich bei der Autosammenfassung und hab' ich aktuell zwei drin.

00:59:35: also man kann auch mehr wegenervieren.

00:59:37: Schalterpräsentation Die Präsention Und die Videoübersicht Ja.

01:00:00: Die Frage, die jetzt gerade kam im Chat ist die Funktion hilfreich für die Erstellung von PowerPoints?

01:00:06: Nee das erstellt keine Powerpoint.

01:00:08: also es erstellt halt so eine Art Präsentation mit Folien aber du müsstest die dann im Notebook Ellen direkt präsentieren.

01:00:18: Das ist eher so zum Lernen für dich und weniger zum Präsentieren über Powerpoint.

01:00:24: Man kann das Ganze auch nicht im Powerpoint exportieren.

01:00:28: Ja, das war Notebook LM.

01:00:31: Da steckt einiges drin in diesem Tool.

01:00:34: Da empfehle ich wirklich einfach... Auch weil es auf Deutsch ist, es einfach mal auszuprobieren.

01:00:40: Denn das bietet wirklich einiges.

01:00:49: Quellen zu einem Thema hat, vor allem die da analysieren zu lassen verschiedene Formate auch mal zu nutzen.

01:00:57: Sei es der Podcast, sei es die Fragen, sei ist das die Präsentationen in die Videoübersicht wenn das was bringt oder das Quiz oder die Karteikarten und auch die visuellen Dinge, wenn man natürlich das gut nutzen kann.

01:01:13: Und Notebook-Elems ist sehr gut bedienbar mit Screen wieder.

01:01:16: Da gibt's gar keine Einschränkungen Auch bei der Konfiguration nicht, ich habe jetzt nicht alles gezeigt.

01:01:23: In der Vollversion kann man dann wie gesagt diese Audio-Zusammenfassungen alles noch steuern.

01:01:29: Da geht einiges.

01:01:30: Kommen wir zu dem Thema das ganz häufig genannt wird wenn es um KI geht und uns aber nicht so viel Anschauungsmaterial bietet oder den meisten von uns zumindest nicht, das Thema Bilder.

01:01:51: Es gibt diverse Bild-Generierungsanwendungen, Bild-Genervierungsmodelle.

01:02:00: Das sind dann Begriffe wie DALLi von OpenAI also von Chatchity Herstellern, Imagen oder Nano Banana von Google und die erzeugen eben Austextbeschreibung ein Bild oder mehrere Bilder.

01:02:17: Wir beschreiben was wir haben wollen, wie das immer ist bei KI.

01:02:21: Ich wiederhole mich da weil es halt immer das gleiche ist und wir bekommen ein Bild Und gibt's eben verschiedene Tools.

01:02:30: Diese Tools sind auch zum großen Teil direkt in die Chatbots integriert Die wir auch schon kennen aus den anderen Modulen Also Dali und OpenAI ist natürlich direkt im ChatGPT integriered.

01:02:46: Erstelle ein Bild von einer Katze die auf einem Störfbett steht.

01:02:50: Es wird halt erstellt, weil es natürlich jetzt bei der Anweisung viel zufällig.

01:02:55: Also barben Hintergrund, keine Ahnung, wird da alles mit generiert.

01:03:03: Ein guter Bild prompt, der ein gutes Bild generiert, das nicht zufältig ist, sondern auch wirklich den Vorstellungen entspricht, hätte mit Sicherheit genauso wie bei der Musik auch mehr Bezahlen und man kann's aber eben auch offen halten und da eben nur das Nötigste eingeben.

01:03:25: In Chaminoi haben wir da Image-N, das muss man sich eigentlich nicht merken, sondern es wird einfach genutzt.

01:03:30: wenn wir die Anwendung fragen, wenn wir jetzt Chaminoivwagen generieren mehr ein Bild dann wird das Ganze genutst.

01:03:39: also beispielsweise jetzt generieren wir einen Logo für den DBSV KI Seminar Und wir geben da wieder was rein meine ich wegen der Zusammenfassung von von Notebook LM sagen ein bisschen, wie wir das haben wollen.

01:03:54: Und dann kommt er da entweder mit ein paar Ideen oder halt eben mit einem Bild oder mehr bei den Bildern hin nach dem, wo Nachwähn fragen.

01:04:08: Es gibt dann auch Spezialwerkzeuge, mit denen man kleinere oder schneller einfach schneller Bilder generieren kann und mittlerweile gibt es das auch offline.

01:04:20: also wir können auch offline Bilder generiren.

01:04:23: Mit Journey habe ich im Hand-Out noch drin.

01:04:26: Das ist eine separate Anwendung, mit der wir Bilder generieren können, also unabhängig von den großen Chatbots.

01:04:35: So was wie jetzt Suno bei Musik wäre, wäre mit Journey bei Bildern.

01:04:41: Das war lange Zeit in der Bildqualität und hauptsächlich in der bildqualität aber auch in den Anweisungen dem, was man damit machen konnte.

01:04:55: Das Beste mittlerweile haben die anderen längst aufgeholt.

01:05:01: Die Bedienbarkeit für Screenreader-Nutzer ist natürlich generell ganz gut weil wir normalerweise einfach die Chatbots nutzen.

01:05:14: Ich glaube mit Journey ist jetzt tatsächlich nicht so gut wenn man das nutzen will.

01:05:19: Wenn man aber die Chatbot nutzt dann ist es ganz gut.

01:05:24: Das, was rauskommt ist natürlich die Frage.

01:05:28: Es kommt immer ein Bild raus.

01:05:30: also als reiner Screen-Wiedernutzer das Vollbild in der Screenwiedernutzer habe ich davon erst mal nicht viel.

01:05:36: Ich muss mir das Bild wieder irgendwie durch eine Bildererklärungs App jagen, durch einen Alternativtext Generator jagen und beschreiben lassen.

01:05:47: Was mache ich am besten?

01:05:49: In einem separaten Fenster, also nicht vom selben nicht im selben Chat-Fenster, in dem ich das Bild generiert habe.

01:05:59: Das wäre ein bisschen kontraproduktiv.

01:06:00: dann würde der Kontext ist ja dann sozusagen da von dem was ich haben wollte in den Bild und das könnte zu Fehlern führen.

01:06:13: Das kann man auch mit ChatGPT oder Gemini oder sowas machen.

01:06:17: aber dann würde ich eher das Bild runterladen und das sozusagen nochmal ein anderes Fenster geben und dann noch mal separat fragen Was ist denn auf diesem Bild?

01:06:26: Beschreib mir das mal genau und beschreib mir auch mal, wie es wirkt.

01:06:31: Denn KI-generierte Bilder wirken.

01:06:35: mittlerweile sind die auch spitze geworden.

01:06:38: also ist die Qualität auch super, super gut geworden.

01:06:42: aber es kann immer noch zu fehlen führen.

01:06:45: ganz, ganz klassisch was ganz klassisch war.

01:06:49: an Händen haben oft Finger gefehlt.

01:06:52: Also eine Hand mit fünf Fingern zu bauen, das ist der KI oft nicht gelungen.

01:06:59: Und wenn halt an so einer Hand irgendwie ein Finger gefehlt hat dann hat man oft gut erkannt dass es eben KI generiert ist.

01:07:06: definitiv mittlerweile haben die Tools das ganze eher in Griff gekriegt.

01:07:14: also mit den Händen passiert meines Wissens noch nie mehr so oft.

01:07:21: Es passieren anwesende Wirkungen Zum.

01:07:23: Bild hat ja auch ganz, ganz viele Facetten genauso wie Musikstückfasetten hat.

01:07:28: Hat ein Bild oder einen Videofasetten und da merkt man schon oft noch dass es KI generiert ist.

01:07:37: und gleichzeitig sind genau so wie bei der Musik, genauso wie bei den Stimmen Bilder schon erstaunlich, erstaundlich realistisch.

01:07:52: So, wofür brauchen wir das ganze jetzt?

01:07:53: Naja Social Media Beiträge beispielsweise mit Fotos einfach zu illustrieren, Präsentationsfolien mit Fotostes zu illustrieren.

01:08:06: Also man kann ja auch Grafiken bauen und muss nicht in die Bilder von Menschen jetzt bauen oder so sondern man kann auch Illustrationsgrafiken zum Beispiel gebauten.

01:08:14: Wenn ich jetzt so ein KI Seminar für Sieende mache dann nutze ich das weil man kann mit diesen Tools einfach viele illustriern.

01:08:27: Bilder generieren fällt uns halt schwer, gerade als Blinde mit Photoshop oder mit Canva oder mit Tools die es da gibt.

01:08:38: Das geht mit KI tatsächlich dann eher.

01:08:42: Natürlich gibt's auch kreativer Webprojekte also Logos, Buch covers, Visitenkarten, Designs

01:08:50: usw.,

01:08:52: alles geht so... Dann kommen wir zu dem ganzen Thema Videos.

01:08:59: Da passiert in den Jahr- und Jahrzehnten eine versandte Entwicklung.

01:09:03: Ein paar Werkzeuge möchte ich da auch vorstellen, also natürlich können wir eben das Ganze mit Videos machen.

01:09:11: wenn wir Bild generieren können, wenn wir Ton generieren kann dann ist das Video nicht weit.

01:09:18: und da gibt es zum Beispiel damit man's mal gehört hat das Tool Hagen ist sozusagen ein Konzept, das sich Avatar nennt.

01:09:32: Das macht einfach aus fünfzehn Sekunden ungefähr Video, Spannung und selber also von mir erstellt es sozusagen einen digitalen Zwilling.

01:09:44: Und dieser digitale Zwilling, dieser Avatar spricht dann jeden Text in meiner Stimme und mit meinem Gesichtsausdruck, mit meiner Mimik und so weiter.

01:09:58: Das heißt, was mache ich?

01:09:59: Ich gebe dann nur noch einen Text ein und heygen produzierten Video dazu und lässt halt diesen Avatar genau diesen Text sprechen natürlich auch in verschiedenen Sprachen klar wenn ich sprachen darf kann Wenn ich sprache übersetzen kann Dann ist auch da der Weg nicht weit.

01:10:23: das ganze ist Erstaunlich und ein bisschen beängstigend, weil das natürlich auch so funktioniert nicht nur die Stimmeklonen sondern tatsächlich auch den ganzen Gesichtsausdruck.

01:10:33: Und die ganze Mimik usw.

01:10:37: und halt da auch mitlernt.

01:10:42: Das Ganze hat natürlich auch ethische Konsequenzen, darauf komme ich gleich noch.

01:10:48: Nutzen können wir das Ganze für zum Beispiel Erklärvideos in verschiedenen Sprachen, wenn ich es nicht selber aufnehmen kann oder will.

01:11:01: Oder halt einfach nicht die Ressourcen dazu habe.

01:11:03: Ja das letzte Tool hier ist Twelve Labs.

01:11:07: Es gibt nicht nur Eleven Labs, es gibt auch Twelve Labs.

01:11:10: Also natürlich hat sich Twelve Labs da diesen Namen offensichtlich abgeguckt und Twelve Labs geht so ein bisschen den umgekehrten Weg von Hagen anstatt Videos zu erzeugen, versteht es bestehende Videos und kann per natürlicher Sprache mit einem Video interagieren.

01:11:32: Also auch mit stundenlangen Videomaterial.

01:11:36: Ich kann zum Beispiel so versuchen wie ich finde die Stelle wo der Sprecher die Folie fünf zeigt also wenn's jetzt eine Pension ist mit Folien oder in dem Video dessen.

01:11:46: das passiert bei uns.

01:11:48: perspektivisch interessant Wo waren wir da gleich denken, ist natürlich Audio-Description.

01:11:55: Wenn Videos beschrieben werden können, ist der Weg zu Audio-deskriptionen auch nicht mehr so weit.

01:12:03: aber auch Videos durchsuchen und Beschreiben zusammenfassen Auch das geht alles schon.

01:12:10: Und da sind dieses Twelve Labs jetzt hier nicht das einzige Tool sondern Da gibt es mehrere.

01:12:16: Beispielsweise YouTube-Videos kann ich mit Google sehr gut zusammen fassen und wir beschreiben lassen.

01:12:25: Auch das funktioniert mit Gemini gut, auch mit ChatGPT Und auch die chatbots können eben schon Videos generieren.

01:12:35: Ich habe den Schwerpunkt jetzt nicht auf Bilder und Videos gelegt wenn ich glaube dass Musik und dieses Notebook LM deutlich interessanter waren.

01:12:44: Im Handout steht noch ein bisschen mehr dazu drin.

01:12:49: Ich komme jetzt noch zu einem anderen Thema was wieder eher im Audio-Bereich angesiedelt ist, nämlich zum Thema Audioschnitt und Audiobearbeitung.

01:13:01: Also was ist jetzt wenn ich so ein Podcast habe?

01:13:05: Vom DVSV oder von diesem Seminar hier dann muss sich das Ganze natürlich schneiden.

01:13:11: Das ganze Mastering, das ganze Nachbearbeiten kostet Zeit Und da gibt es auch schon Tools die das Ganze automatisieren und mir ganz gut abnehmen.

01:13:23: Was ich zum Beispiel genutzt habe schon ist Autonic.

01:13:27: Autonic ist ein Dienst eben genau für automatisches Audiumastering und da gibt es verschiedene Modi, das Ganze ist auch für uns ganz okay bedienbar in der Oberfläche.

01:13:46: Es sind die wichtigsten Sachen.

01:13:48: auf jeden Fall gut bedienen wir auch mit NVR ja und Windows.

01:13:52: Was kann ich damit tun?

01:13:54: Lautstärke optimieren, Rauschen entfernen.

01:13:57: Den Pegel optimieren und schauen, dass die Stimme einfach klarklingt.

01:14:03: Dass der Hall entfernt wird.

01:14:06: All das verbirgt sich da hinter zwei oder drei Funktionen.

01:14:10: Das ist auch wirklich wirklich einfach zu bedienen.

01:14:15: Und ... Ich kann auch schneiden!

01:14:16: Also ich kann zum Beispiel Arten, Geräusche rausschneiden und auch Füllwörter rausschneiden.

01:14:23: Also da steckt ein KI-Modell dahinter, dem wurde beigebracht was ist ein Füllwort?

01:14:27: Was ist ein Atemgewäusch?

01:14:29: Und das schneidet wirklich so Sachen raus.

01:14:35: gerade wenn es nur Sprecher gibt also keine Hintergrundgewäusche und auch sonstige keine sonstigen Geräusche die vielleicht das ganze nochmal stören funktioniert das sehr gut.

01:14:55: Wie würde ich das machen?

01:14:57: Also, das Ganze nimmt man auf natürlich.

01:15:01: Als MP-II oder als VVBHV lädt man beiophonik hoch und stellt eben den Modus ein was man ihm will.

01:15:09: also entweder jetzt Rauschen entfernen nur oder eine Stille entfernen auch oder mit den Füllwörtern und Artengewäuschen und dann dauert es einen ganzen Moment als mp-III runter.

01:15:28: Das wird dann runterkomprimiert, das ist kein VRV mehr sondern ein mp III in ganz guter Qualität.

01:15:35: aber es wird eben auch darunter kompromiert.

01:15:40: In der Pro-Version geht da natürlich noch deutlich mehr und das Ganze erspart enorm an Zeit.

01:15:51: Ein weiteres Tool in dem Zusammenhang gibt es noch heißt Descript.

01:15:58: Mit Descript kann ich ähnliche Sachen tun, wie auch mit aufwornigen Fans nur nicht so gut bedienbar.

01:16:07: Warum mich das hier nennen ist?

01:16:08: Weil Descript tatsächlich noch einen Schritt weitergeht.

01:16:13: es transkribiertes Gesprochene über auch wieder.

01:16:18: so ein Modell wie Whisper zeigt das Ganze als Text an und lässt mich den Text bearbeiten Und so kann ich dann eben mein Mein Podcast, mein Audio was ich aufgenommen habe schneiden.

01:16:30: Also wenn ich eine Wörter rausschneide aus dem Text also Rauslösch und den Text dann wieder an das Tool schick Dann gibt mir eben das Tool den Audiobeitrag, den ich vorher aufgenommen hab eben ohne diesen Satz wo ich mich vielleicht versprochen habe oder so.

01:16:53: So jetzt kommen wir noch zu dem letzten Thema und es ist wichtig rechtliches Und ein bisschen Ethik.

01:17:01: Also erst mal, wem gehören diese generierten Werke?

01:17:06: Wenn ich jetzt irgendwas generiere.

01:17:09: Ein Musikstück oder ein Bild oder ein Video.

01:17:14: Wem gehört es?

01:17:15: und da wie schon gesagt habe ist der Blick in die AGB Pflicht wenn ich das Ganze für irgendetwas anderes auch nutzen will.

01:17:24: Im Privat ist es eher egal.

01:17:26: aber wenn ich halt das ganze veröffentliche einen großen Podcast habe oder einen großen ... Dann ist es definitiv laut, da in die ARGB zu schauen.

01:17:46: Und oft ist es so wie bei Suno zum Beispiel dass die Privatnutzung uneingeschränkt erlaubt ist.

01:17:52: Also das ist eigentlich immer so.

01:17:54: und die kommerzielle Nutzung also verkaufen wenn du wirklich verkaufst.

01:18:00: Wenn du damit Geld verdienst mit diesen Inhalten.

01:18:04: Dann ist ein Paro oder Premium-Abo notwendig, so ist es zum Beispiel bei Suno um die kommerziellen Rechte zu haben und dann darf ich auch diese Saisons nutzen eben um mein Produkt zu bewerben also um damit was zu verkaufen.

01:18:19: Das ist von Tool to Tool unterschiedlich.

01:18:21: das lohnt sich da der Blick in den AGB eigentlich Pflicht wenn man sowas machen will um rechtlich auf der sicheren Seite zu sein.

01:18:30: Bei Notebook LMS ist das Ganze tatsächlich noch ein bisschen offener.

01:18:34: Die beanspruchen gar keinen Besitz an den generierten Inhalten, die Podcasts können verwendet werden.

01:18:45: für die hochgeladenen Quellen bin ich aber selber verantwortlich.

01:18:48: also wenn ich da irgendwas hochlad was mir gar nicht gehört oder was sich gar nicht da hochladen darf dann bin ich dafür selber verantwortlich und dann da war es ein Podcast generviert und denen dann veröffentlicht.

01:19:01: dann können wir trotzdem rechtwillige Konsequenzen tropen, wenn ich einfach diese Quellen nicht... Also wenn ich da nicht Eigentümer bin oder die nicht offen zugänglich sind.

01:19:11: Auch nur mal ins Hand-Out schauen, das steht auch noch ein bisschen was dazu drin im Forum.

01:19:15: Die Faustregel ist Was ich machen würde vor jedem kommerziellen Einsatz eben die AGBs prüfen.

01:19:25: Da kann man ja auch KI nutzen mit Quellennangabe.

01:19:29: Das ist möglich.

01:19:29: Einfach eine KI-Bescherche.

01:19:31: Hey, wäscher Schimme mal in den AGB von Toolix Y. Ob das was ich da tue erlaubt ist, sag mir warum und warum nicht?

01:19:40: Und dann aber am besten hier weil wir haben ja gelernt alle wichtigen Informationen prüfen einfach nochmal den Link um sich ausgeben lassen, einfach nochmal nachfahren.

01:19:57: Wichtig bei dem Ganzen Genervieren von Inhalten.

01:20:05: Die Ethik habe ich auch schon genannt, ich nenne sie zum Schluss nochmal.

01:20:09: Äthik und Verantwortung wie aus dem ersten Modul schon bekannt.

01:20:15: es gibt sogenannte Deepfakes.

01:20:17: was AI generiert ist von irgendeinem Menschen das gar nicht existiert.

01:20:25: Das Ganze ist gefährlich wenn man es nicht ernst nimmt.

01:20:29: also niemandes Stimme oder Bild darf einfach so verwendet werden.

01:20:37: Aber wie gesagt, ich kann jetzt nicht einfach die Stimme von der Wobby klonen und denen irgendwas sprechen lassen oder sein Bild irgendetwas ... oder seinen Foto nehmen.

01:20:45: Und das irgendwie durch KI verändern oder ihn irgendwo anders darstellen oder so.

01:20:53: KI-Inhalte kennzeichnen.

01:20:54: wichtig, müssen wir tun laut KI Recht.

01:21:01: Müssen wir allermeistens tun?

01:21:03: Ich würde es einfach tun!

01:21:05: Ja also wenn ihr KI Inhalte habt... Kenntzeichnen.

01:21:11: Einfach sagen, dass das KI generiert ist wie das ganze zum Beispiel eben auch bei diesem Hörfelnbeispiel ist.

01:21:19: wir schauen einen Hörfel mit ZDF und am Ende wird uns gesagt diese Hörfeinfassung wurde durch eine KI optimierte Stimme erzeugt gefälschte Stimmen oder sowas.

01:21:34: Das ist ein reales Problem vor allem in Social Media Und vor allem bei politischen Manipulationen Aber auch zum Beispiel bei sowas wie Enkeltrick-Anrufen.

01:21:45: Es gibt schon die Verbrecher, die solche Trickanrufe bei älteren Menschen tatsächlich mit geklontem Stimmen dann machen und damit natürlich erfolgreicher sind weil man die Stimme vielleicht erkennt.

01:22:07: Ich bin am Ende von Modul fünf KI-Workshops.

01:22:12: Und ich möchte einfach wirklich nur mir Danke sagen, danke an Avavio und Tanya natürlich für die Unterstützung hier oder überhaupt ums möglich zu machen und für die tolle Moderation auch für die Tolle Hilfe beim Chat usw.

01:22:30: Und vor allem danke an euch, an sie alle dass alle dabei waren das so viele Leute sich dafür interessiert haben dass so viele leute sich immer wieder eingewählt haben Und ja, einfach dabei waren und vielen Dank fürs Interesse.

01:22:52: Zum Schluss nochmal der Hinweis auf unseren Forenswert.

01:22:54: Der kann natürlich weiterhin genutzt werden zum Austausch über die eigenen Erfahrungen mit KI.

01:22:59: Dazu geht ihr auf offsite.de und da in die Kategorie rund um Hilfsmittel.

01:23:03: Da findet ihr dann KI verstehen und clever nutzen.

01:23:06: Ansonsten findet ihr den Link auch in den Show Notes.

01:23:13: Der Offside Podcast wird herausgegeben vom DBSV Jugendclub.

01:23:16: Redaktion dieser Ausgabe Robby Sandberg.

01:23:18: Feedback gerne an er.sandberg-dbsv.org.

Über diesen Podcast

Wir informieren junge blinde und sehbehinderte Menschen über die Angebote des DBSV, über barrierefreie Games und Gadgets, beschäftigen uns mit Lifestyle, Kultur und Politik.
Besucht uns auf http://www.dbsv.org/jugendliche.html

von und mit DBSV-Jugendreferat

Abonnieren

Follow us