Deepfakes, nu med lyd!

Musikbranche og ophavsrettigheder, musikteori, artister, sange og videoer, butikker.
Nyt svar
Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Deepfakes, nu med lyd!

Indlæg af Mike-air »

En Canadisk startup har trainet en model til at efterligne Joe Rogans stemme:



Med reference til vores tidligere AI diskussioner, er mit bud at det er en GAN-version af googles WaveNet.
https://openreview.net/forum?id=H1xQVn09FX

Medlemsavatar
the19thbear
Medlem
Indlæg: 3339
Sted: Roskilde

Indlæg af the19thbear »

Det er virkelig skræmmende og fascinerende med deep learning. Selvkørende biler. Flydesign. Video og stemme-kopiering. Robotter som kan mere og mere.
Helt alvorligt tror jeg at vi står ved en skillevej. Inden for de næste 30 år vil samfundet være på vej over i en ny retning a la i starten af de industrielle revolution.
Det er ret vildt.


Sent from my iPhone using Tapatalk

Medlemsavatar
Holger
Audio Alchemist
Indlæg: 37672
Sted: Fyn

Indlæg af Holger »

Mike-air skrev:En Canadisk startup har trainet en model til at efterligne Joe Rogans stemme:



Med reference til vores tidligere AI diskussioner, er mit bud at det er en GAN-version af googles WaveNet.
https://openreview.net/forum?id=H1xQVn09FX
Virkelig imponerende. Lydkvaliteten er relativt dårlig og der er et give-away lige i starten, men ellers er den købt 100%.

Medlemsavatar
Christoffer I. N.
Lydmaskinist
Indlæg: 35558
Sted: Hørsholm

Indlæg af Christoffer I. N. »

Tak for deling Mike :thumbup:

Medlemsavatar
Joachip
Forum Donator
Indlæg: 2641
Sted: Vesterbro

Indlæg af Joachip »

I teorien kunne man efterligne Trumps stemme, og få ham til at sige alle mulige fuldstændigt forrykte ting som en præsident ellers aldrig ville have sagt.


:roll:


Nej vent, den skal jeg vist lige tænke igennem igen...
Jeg laver også gratis plugins: www.robotplanet.dk/audio_plugins

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Det er den slags verden vi kommer til at leve i frem over; ægte indhold kommer til at have en form for nøgle for at det kan valideres.

Vil gerne trække min påstand om at det er let at detektere, tilbage. For i realiteten er det et arms-race indtil ny teknologi dukker op.

Medlemsavatar
SustainerPlayer
Medlem
Indlæg: 12411
Sted: På kanten

Indlæg af SustainerPlayer »

Det bliver The Matrix - bare en anden indpakning - og ingen seje solbriller.

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Fra et videnskabeligt perspektiv ser jeg både hvorfor man forsøgte dette, samt hvilken værdi det har. Selve GAN-teknologien (Generative Adversarial Models: dvs. Modeller som ‘genererer data’ kontra at tolke på data) blev udviklet på billed-data, og her var de første eksperimenter på billeder af objekter, dernæst ansigter og det har så udviklet sig siden da fordi det var særdeles vanskeligt. Det er vel blot naturligt at lave koblingen til video og lyd efterfølgende..

Man kan måske også forsvare det med at det er bedre noget sådant bliver open sourcet fra starten så alle er klar indblik i hvad der er muligt.

Måske vi skal være glade for det er google som driver denne forskning, kontra et af de statsstyrede selskaber i Kina eller Rusland? :-P

Alligevel syntes jeg dog et eller andet sted at det er åndssvagt at man går så langt som man er gået med deepfakes.

Medlemsavatar
Hald
Forum Donator
Indlæg: 10829
Sted: Vind / Holstebro

Indlæg af Hald »

Spørgsmålet er hvor længe der går før vi køber smartphones hvor telefondelen er lukket da vi ikke længere stoler på talekommunikation, eller ikke magter den konstante hær af reklamerobotter der ringer og udgiver sig for at være mennesker.
"Knobs? Where we're going, we don't need knobs!" - 14 år med ørene i Lydmaskinen -

Medlemsavatar
SustainerPlayer
Medlem
Indlæg: 12411
Sted: På kanten

Indlæg af SustainerPlayer »

Det vil jo være en forsat kamp. Men jeg er ikke i tvivl om, at man vil indføre love og foranstaltninger omkring det.
Før eller siden bliver teknologien jo allemandseje.

Der vil blive behov for kommunikationsvalidering på alle planer.

Medlemsavatar
Hald
Forum Donator
Indlæg: 10829
Sted: Vind / Holstebro

Indlæg af Hald »

Allerede nu bruger alle filtre på alle sociale platforme, jeg ved ikke engang hvordan mine venner i virkeligheden ser ud længere, hehe..
"Knobs? Where we're going, we don't need knobs!" - 14 år med ørene i Lydmaskinen -

Medlemsavatar
SustainerPlayer
Medlem
Indlæg: 12411
Sted: På kanten

Indlæg af SustainerPlayer »

Joachip skrev:I teorien kunne man efterligne Trumps stemme, og få ham til at sige alle mulige fuldstændigt forrykte ting som en præsident ellers aldrig ville have sagt.


:roll:


Nej vent, den skal jeg vist lige tænke igennem igen...
Det er ikke alle mennesker, der kan bestå en Turing test :dollargrin:

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

SustainerPlayer skrev:Det vil jo være en forsat kamp. Men jeg er ikke i tvivl om, at man vil indføre love og foranstaltninger omkring det.
Før eller siden bliver teknologien jo allemandseje.

Der vil blive behov for kommunikationsvalidering på alle planer.
Lovgivning kommer stille og roligt: F.eks. har San Francisco netop banned brug af facial recognition (dvs. fra det offentlige).
https://www.nytimes.com/2019/05/14/us/f ... cisco.html

Det er indenfor områder som dette hvor EU også kan bevise sit værd, ved at man hurtigere kan implementere lovgivning i alle medlemslande og derved beskytte borgerne. Det er et meget rødt statement. Men dette går så stærkt, og man kan ikke kræve at den gennemsnitlige befolkning har sat sig ind i hvad den nyeste forskning indenfor AI kan.

Medlemsavatar
Holger
Audio Alchemist
Indlæg: 37672
Sted: Fyn

Indlæg af Holger »

Mike-air skrev: Det er indenfor områder som dette hvor EU også kan bevise sit værd, ved at man hurtigere kan implementere lovgivning i alle medlemslande og derved beskytte borgerne. Det er et meget rødt statement.
En absolut fornuftig ting at beskytte imod.

Det har ikke noget med "rødt" at gøre, hvis du her tænker politisk dog.

Både rødt og blåt aka. venstre og højre er ca. lige usympatiske hvad angår overvågning og registrering af borgerne i den vestlige verden, men ofte med forskellige rationaler.

Historisk set har de mest røde haft den mest omsiggribende overvågning, både under Sovjet og ikke mindst i dag i Kina, hvor borgerne mikroovervåges og bliver tildelt social scores.

Gult er ofte associeret med libertarianismen, så måske et gult statement.

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Jeg er langtfra ekspert på de begreber, specielt når det bliver internationalt :-)

En lillesidenote er at jeg tilbage i 2017 hvor Elon Musik foreslog at regulere AI, mente (som størstedelen af feltet) at det var lidt vandvittigt at skulle gøre det. Men idag begynder det at give mere og mere mening: ligesom man regulerer færdsel i trafikken, konkurrence vilkår, og beskytter forbrugeren, så er man nødt til at gøre det med AI, da det strækker sig over _alle_ sektorer.

Når du pludselig kan opnå super-human performance på kognitive tasks på tværs af industrier, så er det ikke særlig vanskeligt at komme med idéer til hvordan dette kan udnyttes. Til gengæld er det vanskeligt at komme på regler/designs som beskytter uvidende mennesker.

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Her er hvad Joe rogan selv mener:


Medlemsavatar
Hald
Forum Donator
Indlæg: 10829
Sted: Vind / Holstebro

Indlæg af Hald »

Men på den anden side kan han lave en podcast ved bare at skrive et manus og bede en AI om at læse det op og poste det til en service.

Spørgsmålet er hvor længe der går før radioavisen bliver AI, så behøver folk heller ikke stå til rådighed ud på de sene timer. Det lyder koldt, men virkeligheden er at flere "DJ's" bliver erstattet af en playliste, der er ikke en garanti for at DJ'en er bedre, men playlisten bliver aldrig lige så god til at fange øjeblikket, ligesom en AI nok ikke ville kunne kommunikere alvorlige emner med empati i stemmen.
"Knobs? Where we're going, we don't need knobs!" - 14 år med ørene i Lydmaskinen -

Medlemsavatar
Hald
Forum Donator
Indlæg: 10829
Sted: Vind / Holstebro

Indlæg af Hald »

Så kan man nok også snart leje sig ind til en AI der kan lave Speaks.. "In a WOOORLD, without unicorns, but with talking bee's"
"Knobs? Where we're going, we don't need knobs!" - 14 år med ørene i Lydmaskinen -

Medlemsavatar
Hald
Forum Donator
Indlæg: 10829
Sted: Vind / Holstebro

Indlæg af Hald »

"Knobs? Where we're going, we don't need knobs!" - 14 år med ørene i Lydmaskinen -

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Stærkt! Tak for deling :-)

Medlemsavatar
Joachip
Forum Donator
Indlæg: 2641
Sted: Vesterbro

Indlæg af Joachip »

John Oliver har også haft det emne oppe og vende:

Jeg laver også gratis plugins: www.robotplanet.dk/audio_plugins

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Næste skridt: predikere ansigt, baseret på stemmen!
DC63D0B9-C42E-41F9-A29B-6E8890DA5EF9.jpeg
Fuld artikkel:
https://arxiv.org/pdf/1905.09773.pdf

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Så er der satme nogen der har brugt teknikken på Trumps taler. Lyder dog lidt som om at modellen har svært ved at generalisere til ord trump måske ikke har sagt så ofte:


Medlemsavatar
Christoffer I. N.
Lydmaskinist
Indlæg: 35558
Sted: Hørsholm

Indlæg af Christoffer I. N. »

Grinern, lyder som en blanding af timestretching og høj FFT size processering.

Medlemsavatar
Mike-air
Forum Donator
Indlæg: 10300
Sted: Oslo

Indlæg af Mike-air »

Jeg får vitterligt lyst til at lege med dette, men jeg har hverken GPU-kraft eller tiden til det..

Nyt svar