Deepfakes, nu med lyd!
Deepfakes, nu med lyd!
En Canadisk startup har trainet en model til at efterligne Joe Rogans stemme:
Med reference til vores tidligere AI diskussioner, er mit bud at det er en GAN-version af googles WaveNet.
https://openreview.net/forum?id=H1xQVn09FX
Med reference til vores tidligere AI diskussioner, er mit bud at det er en GAN-version af googles WaveNet.
https://openreview.net/forum?id=H1xQVn09FX
- the19thbear
- Medlem
- Indlæg: 3339
- Sted: Roskilde
Det er virkelig skræmmende og fascinerende med deep learning. Selvkørende biler. Flydesign. Video og stemme-kopiering. Robotter som kan mere og mere.
Helt alvorligt tror jeg at vi står ved en skillevej. Inden for de næste 30 år vil samfundet være på vej over i en ny retning a la i starten af de industrielle revolution.
Det er ret vildt.
Sent from my iPhone using Tapatalk
Helt alvorligt tror jeg at vi står ved en skillevej. Inden for de næste 30 år vil samfundet være på vej over i en ny retning a la i starten af de industrielle revolution.
Det er ret vildt.
Sent from my iPhone using Tapatalk
Virkelig imponerende. Lydkvaliteten er relativt dårlig og der er et give-away lige i starten, men ellers er den købt 100%.Mike-air skrev:En Canadisk startup har trainet en model til at efterligne Joe Rogans stemme:
Med reference til vores tidligere AI diskussioner, er mit bud at det er en GAN-version af googles WaveNet.
https://openreview.net/forum?id=H1xQVn09FX
- Christoffer I. N.
- Lydmaskinist
- Indlæg: 35560
- Sted: Hørsholm
Tak for deling Mike
25. Oktober 2022 - ny musikalsk videolog - Mørkt og minimalt, 5-lags soundscape
-
Jeg er betatester for BABY Audio.
-
Jeg er betatester for BABY Audio.
I teorien kunne man efterligne Trumps stemme, og få ham til at sige alle mulige fuldstændigt forrykte ting som en præsident ellers aldrig ville have sagt.
Nej vent, den skal jeg vist lige tænke igennem igen...
Nej vent, den skal jeg vist lige tænke igennem igen...
Jeg laver også gratis plugins: www.robotplanet.dk/audio_plugins
Det er den slags verden vi kommer til at leve i frem over; ægte indhold kommer til at have en form for nøgle for at det kan valideres.
Vil gerne trække min påstand om at det er let at detektere, tilbage. For i realiteten er det et arms-race indtil ny teknologi dukker op.
Vil gerne trække min påstand om at det er let at detektere, tilbage. For i realiteten er det et arms-race indtil ny teknologi dukker op.
- SustainerPlayer
- Medlem
- Indlæg: 12411
- Sted: På kanten
Det bliver The Matrix - bare en anden indpakning - og ingen seje solbriller.
Fra et videnskabeligt perspektiv ser jeg både hvorfor man forsøgte dette, samt hvilken værdi det har. Selve GAN-teknologien (Generative Adversarial Models: dvs. Modeller som ‘genererer data’ kontra at tolke på data) blev udviklet på billed-data, og her var de første eksperimenter på billeder af objekter, dernæst ansigter og det har så udviklet sig siden da fordi det var særdeles vanskeligt. Det er vel blot naturligt at lave koblingen til video og lyd efterfølgende..
Man kan måske også forsvare det med at det er bedre noget sådant bliver open sourcet fra starten så alle er klar indblik i hvad der er muligt.
Måske vi skal være glade for det er google som driver denne forskning, kontra et af de statsstyrede selskaber i Kina eller Rusland?
Alligevel syntes jeg dog et eller andet sted at det er åndssvagt at man går så langt som man er gået med deepfakes.
Man kan måske også forsvare det med at det er bedre noget sådant bliver open sourcet fra starten så alle er klar indblik i hvad der er muligt.
Måske vi skal være glade for det er google som driver denne forskning, kontra et af de statsstyrede selskaber i Kina eller Rusland?
Alligevel syntes jeg dog et eller andet sted at det er åndssvagt at man går så langt som man er gået med deepfakes.
Spørgsmålet er hvor længe der går før vi køber smartphones hvor telefondelen er lukket da vi ikke længere stoler på talekommunikation, eller ikke magter den konstante hær af reklamerobotter der ringer og udgiver sig for at være mennesker.
"Knobs? Where we're going, we don't need knobs!" - 14 år med ørene i Lydmaskinen -
- SustainerPlayer
- Medlem
- Indlæg: 12411
- Sted: På kanten
Det vil jo være en forsat kamp. Men jeg er ikke i tvivl om, at man vil indføre love og foranstaltninger omkring det.
Før eller siden bliver teknologien jo allemandseje.
Der vil blive behov for kommunikationsvalidering på alle planer.
Før eller siden bliver teknologien jo allemandseje.
Der vil blive behov for kommunikationsvalidering på alle planer.
- SustainerPlayer
- Medlem
- Indlæg: 12411
- Sted: På kanten
Det er ikke alle mennesker, der kan bestå en Turing testJoachip skrev:I teorien kunne man efterligne Trumps stemme, og få ham til at sige alle mulige fuldstændigt forrykte ting som en præsident ellers aldrig ville have sagt.
Nej vent, den skal jeg vist lige tænke igennem igen...
Lovgivning kommer stille og roligt: F.eks. har San Francisco netop banned brug af facial recognition (dvs. fra det offentlige).SustainerPlayer skrev:Det vil jo være en forsat kamp. Men jeg er ikke i tvivl om, at man vil indføre love og foranstaltninger omkring det.
Før eller siden bliver teknologien jo allemandseje.
Der vil blive behov for kommunikationsvalidering på alle planer.
https://www.nytimes.com/2019/05/14/us/f ... cisco.html
Det er indenfor områder som dette hvor EU også kan bevise sit værd, ved at man hurtigere kan implementere lovgivning i alle medlemslande og derved beskytte borgerne. Det er et meget rødt statement. Men dette går så stærkt, og man kan ikke kræve at den gennemsnitlige befolkning har sat sig ind i hvad den nyeste forskning indenfor AI kan.
En absolut fornuftig ting at beskytte imod.Mike-air skrev: Det er indenfor områder som dette hvor EU også kan bevise sit værd, ved at man hurtigere kan implementere lovgivning i alle medlemslande og derved beskytte borgerne. Det er et meget rødt statement.
Det har ikke noget med "rødt" at gøre, hvis du her tænker politisk dog.
Både rødt og blåt aka. venstre og højre er ca. lige usympatiske hvad angår overvågning og registrering af borgerne i den vestlige verden, men ofte med forskellige rationaler.
Historisk set har de mest røde haft den mest omsiggribende overvågning, både under Sovjet og ikke mindst i dag i Kina, hvor borgerne mikroovervåges og bliver tildelt social scores.
Gult er ofte associeret med libertarianismen, så måske et gult statement.
Jeg er langtfra ekspert på de begreber, specielt når det bliver internationalt
En lillesidenote er at jeg tilbage i 2017 hvor Elon Musik foreslog at regulere AI, mente (som størstedelen af feltet) at det var lidt vandvittigt at skulle gøre det. Men idag begynder det at give mere og mere mening: ligesom man regulerer færdsel i trafikken, konkurrence vilkår, og beskytter forbrugeren, så er man nødt til at gøre det med AI, da det strækker sig over _alle_ sektorer.
Når du pludselig kan opnå super-human performance på kognitive tasks på tværs af industrier, så er det ikke særlig vanskeligt at komme med idéer til hvordan dette kan udnyttes. Til gengæld er det vanskeligt at komme på regler/designs som beskytter uvidende mennesker.
En lillesidenote er at jeg tilbage i 2017 hvor Elon Musik foreslog at regulere AI, mente (som størstedelen af feltet) at det var lidt vandvittigt at skulle gøre det. Men idag begynder det at give mere og mere mening: ligesom man regulerer færdsel i trafikken, konkurrence vilkår, og beskytter forbrugeren, så er man nødt til at gøre det med AI, da det strækker sig over _alle_ sektorer.
Når du pludselig kan opnå super-human performance på kognitive tasks på tværs af industrier, så er det ikke særlig vanskeligt at komme med idéer til hvordan dette kan udnyttes. Til gengæld er det vanskeligt at komme på regler/designs som beskytter uvidende mennesker.
Men på den anden side kan han lave en podcast ved bare at skrive et manus og bede en AI om at læse det op og poste det til en service.
Spørgsmålet er hvor længe der går før radioavisen bliver AI, så behøver folk heller ikke stå til rådighed ud på de sene timer. Det lyder koldt, men virkeligheden er at flere "DJ's" bliver erstattet af en playliste, der er ikke en garanti for at DJ'en er bedre, men playlisten bliver aldrig lige så god til at fange øjeblikket, ligesom en AI nok ikke ville kunne kommunikere alvorlige emner med empati i stemmen.
Spørgsmålet er hvor længe der går før radioavisen bliver AI, så behøver folk heller ikke stå til rådighed ud på de sene timer. Det lyder koldt, men virkeligheden er at flere "DJ's" bliver erstattet af en playliste, der er ikke en garanti for at DJ'en er bedre, men playlisten bliver aldrig lige så god til at fange øjeblikket, ligesom en AI nok ikke ville kunne kommunikere alvorlige emner med empati i stemmen.
"Knobs? Where we're going, we don't need knobs!" - 14 år med ørene i Lydmaskinen -
"Knobs? Where we're going, we don't need knobs!" - 14 år med ørene i Lydmaskinen -
Stærkt! Tak for deling
John Oliver har også haft det emne oppe og vende:
Jeg laver også gratis plugins: www.robotplanet.dk/audio_plugins
Næste skridt: predikere ansigt, baseret på stemmen!
Fuld artikkel:
https://arxiv.org/pdf/1905.09773.pdf
Fuld artikkel:
https://arxiv.org/pdf/1905.09773.pdf
- Christoffer I. N.
- Lydmaskinist
- Indlæg: 35560
- Sted: Hørsholm
Grinern, lyder som en blanding af timestretching og høj FFT size processering.
25. Oktober 2022 - ny musikalsk videolog - Mørkt og minimalt, 5-lags soundscape
-
Jeg er betatester for BABY Audio.
-
Jeg er betatester for BABY Audio.