Side 1 af 2

Deepfakes, nu med lyd!

: lør 18. maj 2019 11:24
af Mike-air
En Canadisk startup har trainet en model til at efterligne Joe Rogans stemme:



Med reference til vores tidligere AI diskussioner, er mit bud at det er en GAN-version af googles WaveNet.
https://openreview.net/forum?id=H1xQVn09FX

Re: Deepfakes, nu med lyd!

: lør 18. maj 2019 13:27
af the19thbear
Det er virkelig skræmmende og fascinerende med deep learning. Selvkørende biler. Flydesign. Video og stemme-kopiering. Robotter som kan mere og mere.
Helt alvorligt tror jeg at vi står ved en skillevej. Inden for de næste 30 år vil samfundet være på vej over i en ny retning a la i starten af de industrielle revolution.
Det er ret vildt.


Sent from my iPhone using Tapatalk

Re: Deepfakes, nu med lyd!

: lør 18. maj 2019 15:38
af Holger
Mike-air skrev:En Canadisk startup har trainet en model til at efterligne Joe Rogans stemme:



Med reference til vores tidligere AI diskussioner, er mit bud at det er en GAN-version af googles WaveNet.
https://openreview.net/forum?id=H1xQVn09FX
Virkelig imponerende. Lydkvaliteten er relativt dårlig og der er et give-away lige i starten, men ellers er den købt 100%.

Re: Deepfakes, nu med lyd!

: lør 18. maj 2019 21:23
af Christoffer I. N.
Tak for deling Mike :thumbup:

Re: Deepfakes, nu med lyd!

: søn 19. maj 2019 11:18
af Joachip
I teorien kunne man efterligne Trumps stemme, og få ham til at sige alle mulige fuldstændigt forrykte ting som en præsident ellers aldrig ville have sagt.


:roll:


Nej vent, den skal jeg vist lige tænke igennem igen...

Re: Deepfakes, nu med lyd!

: søn 19. maj 2019 11:53
af Mike-air
Det er den slags verden vi kommer til at leve i frem over; ægte indhold kommer til at have en form for nøgle for at det kan valideres.

Vil gerne trække min påstand om at det er let at detektere, tilbage. For i realiteten er det et arms-race indtil ny teknologi dukker op.

Re: Deepfakes, nu med lyd!

: søn 19. maj 2019 13:52
af SustainerPlayer
Det bliver The Matrix - bare en anden indpakning - og ingen seje solbriller.

Re: Deepfakes, nu med lyd!

: søn 19. maj 2019 14:28
af Mike-air
Fra et videnskabeligt perspektiv ser jeg både hvorfor man forsøgte dette, samt hvilken værdi det har. Selve GAN-teknologien (Generative Adversarial Models: dvs. Modeller som ‘genererer data’ kontra at tolke på data) blev udviklet på billed-data, og her var de første eksperimenter på billeder af objekter, dernæst ansigter og det har så udviklet sig siden da fordi det var særdeles vanskeligt. Det er vel blot naturligt at lave koblingen til video og lyd efterfølgende..

Man kan måske også forsvare det med at det er bedre noget sådant bliver open sourcet fra starten så alle er klar indblik i hvad der er muligt.

Måske vi skal være glade for det er google som driver denne forskning, kontra et af de statsstyrede selskaber i Kina eller Rusland? :-P

Alligevel syntes jeg dog et eller andet sted at det er åndssvagt at man går så langt som man er gået med deepfakes.

Re: Deepfakes, nu med lyd!

: man 20. maj 2019 09:12
af Hald
Spørgsmålet er hvor længe der går før vi køber smartphones hvor telefondelen er lukket da vi ikke længere stoler på talekommunikation, eller ikke magter den konstante hær af reklamerobotter der ringer og udgiver sig for at være mennesker.

Re: Deepfakes, nu med lyd!

: man 20. maj 2019 09:48
af SustainerPlayer
Det vil jo være en forsat kamp. Men jeg er ikke i tvivl om, at man vil indføre love og foranstaltninger omkring det.
Før eller siden bliver teknologien jo allemandseje.

Der vil blive behov for kommunikationsvalidering på alle planer.

Re: Deepfakes, nu med lyd!

: man 20. maj 2019 09:49
af Hald
Allerede nu bruger alle filtre på alle sociale platforme, jeg ved ikke engang hvordan mine venner i virkeligheden ser ud længere, hehe..

Re: Deepfakes, nu med lyd!

: man 20. maj 2019 09:50
af SustainerPlayer
Joachip skrev:I teorien kunne man efterligne Trumps stemme, og få ham til at sige alle mulige fuldstændigt forrykte ting som en præsident ellers aldrig ville have sagt.


:roll:


Nej vent, den skal jeg vist lige tænke igennem igen...
Det er ikke alle mennesker, der kan bestå en Turing test :dollargrin:

Re: Deepfakes, nu med lyd!

: man 20. maj 2019 10:18
af Mike-air
SustainerPlayer skrev:Det vil jo være en forsat kamp. Men jeg er ikke i tvivl om, at man vil indføre love og foranstaltninger omkring det.
Før eller siden bliver teknologien jo allemandseje.

Der vil blive behov for kommunikationsvalidering på alle planer.
Lovgivning kommer stille og roligt: F.eks. har San Francisco netop banned brug af facial recognition (dvs. fra det offentlige).
https://www.nytimes.com/2019/05/14/us/f ... cisco.html

Det er indenfor områder som dette hvor EU også kan bevise sit værd, ved at man hurtigere kan implementere lovgivning i alle medlemslande og derved beskytte borgerne. Det er et meget rødt statement. Men dette går så stærkt, og man kan ikke kræve at den gennemsnitlige befolkning har sat sig ind i hvad den nyeste forskning indenfor AI kan.

Re: Deepfakes, nu med lyd!

: man 20. maj 2019 10:39
af Holger
Mike-air skrev: Det er indenfor områder som dette hvor EU også kan bevise sit værd, ved at man hurtigere kan implementere lovgivning i alle medlemslande og derved beskytte borgerne. Det er et meget rødt statement.
En absolut fornuftig ting at beskytte imod.

Det har ikke noget med "rødt" at gøre, hvis du her tænker politisk dog.

Både rødt og blåt aka. venstre og højre er ca. lige usympatiske hvad angår overvågning og registrering af borgerne i den vestlige verden, men ofte med forskellige rationaler.

Historisk set har de mest røde haft den mest omsiggribende overvågning, både under Sovjet og ikke mindst i dag i Kina, hvor borgerne mikroovervåges og bliver tildelt social scores.

Gult er ofte associeret med libertarianismen, så måske et gult statement.

Re: Deepfakes, nu med lyd!

: tirs 21. maj 2019 11:57
af Mike-air
Jeg er langtfra ekspert på de begreber, specielt når det bliver internationalt :-)

En lillesidenote er at jeg tilbage i 2017 hvor Elon Musik foreslog at regulere AI, mente (som størstedelen af feltet) at det var lidt vandvittigt at skulle gøre det. Men idag begynder det at give mere og mere mening: ligesom man regulerer færdsel i trafikken, konkurrence vilkår, og beskytter forbrugeren, så er man nødt til at gøre det med AI, da det strækker sig over _alle_ sektorer.

Når du pludselig kan opnå super-human performance på kognitive tasks på tværs af industrier, så er det ikke særlig vanskeligt at komme med idéer til hvordan dette kan udnyttes. Til gengæld er det vanskeligt at komme på regler/designs som beskytter uvidende mennesker.

Re: Deepfakes, nu med lyd!

: tirs 21. maj 2019 14:16
af Mike-air
Her er hvad Joe rogan selv mener:


Re: Deepfakes, nu med lyd!

: tirs 21. maj 2019 14:24
af Hald
Men på den anden side kan han lave en podcast ved bare at skrive et manus og bede en AI om at læse det op og poste det til en service.

Spørgsmålet er hvor længe der går før radioavisen bliver AI, så behøver folk heller ikke stå til rådighed ud på de sene timer. Det lyder koldt, men virkeligheden er at flere "DJ's" bliver erstattet af en playliste, der er ikke en garanti for at DJ'en er bedre, men playlisten bliver aldrig lige så god til at fange øjeblikket, ligesom en AI nok ikke ville kunne kommunikere alvorlige emner med empati i stemmen.

Re: Deepfakes, nu med lyd!

: tirs 21. maj 2019 14:32
af Hald
Så kan man nok også snart leje sig ind til en AI der kan lave Speaks.. "In a WOOORLD, without unicorns, but with talking bee's"

Re: Deepfakes, nu med lyd!

: man 27. maj 2019 15:35
af Hald

Re: Deepfakes, nu med lyd!

: man 27. maj 2019 16:13
af Mike-air
Stærkt! Tak for deling :-)

Re: Robocalls

: man 27. maj 2019 19:43
af Joachip
John Oliver har også haft det emne oppe og vende:


Re: Deepfakes, nu med lyd!

: man 27. maj 2019 23:05
af Mike-air
Næste skridt: predikere ansigt, baseret på stemmen!
DC63D0B9-C42E-41F9-A29B-6E8890DA5EF9.jpeg
Fuld artikkel:
https://arxiv.org/pdf/1905.09773.pdf

Re: Deepfakes, nu med Trump og Eminem!

: ons 29. maj 2019 15:00
af Mike-air
Så er der satme nogen der har brugt teknikken på Trumps taler. Lyder dog lidt som om at modellen har svært ved at generalisere til ord trump måske ikke har sagt så ofte:


Re: Deepfakes, nu med lyd!

: ons 29. maj 2019 16:23
af Christoffer I. N.
Grinern, lyder som en blanding af timestretching og høj FFT size processering.

Re: Deepfakes, nu med lyd!

: ons 29. maj 2019 21:51
af Mike-air
Jeg får vitterligt lyst til at lege med dette, men jeg har hverken GPU-kraft eller tiden til det..