Come funziona Shazam? (spiegato da un Data Scientist)

Поділитися
Вставка
  • Опубліковано 13 жов 2024

КОМЕНТАРІ • 74

  • @Rednunzio
    @Rednunzio 5 місяців тому +59

    Dietro quella manciata di secondi c'è molta più scienza di quanto si possa immaginare. Che figata assurda :). Bella spiegazione.

    • @datapizza
      @datapizza  5 місяців тому +3

      Grazie mille! :)

  • @FabrizioBianchi
    @FabrizioBianchi 5 місяців тому +31

    Spiegazione ottima. Sapevo si usasse lo spettrogramma, ma non i dettagli dell'algoritmo e ora li ho super chiari.

    • @datapizza
      @datapizza  5 місяців тому +1

      Super! Grazieeee :)

    • @Mario_Terzi
      @Mario_Terzi 5 місяців тому +1

      Adesso la tua vita è cambiata da così a cosìcosì ;-)

    • @techvigator
      @techvigator 5 місяців тому +2

      Grande, ora che hai tutto super chiaro puoi provare a mettere giù un po' di righe di codice e fare il tuo shazam

  • @ugofiasconaro9704
    @ugofiasconaro9704 5 місяців тому +8

    Per esperienza al giorno d'oggi funziona meglio la funzione "cerca brano" della ricerca google. Ad ogni modo grazie della divulgazione, sempre interessante capire e sapere le tecniche adottate da aziende che hanno avuto successo.

    • @gianlucagiuman6132
      @gianlucagiuman6132 5 місяців тому +1

      Lo credevo anch'io, ma alla fine Shazam trova veramente tutto, mentre la funzione di Google perde colpi...

    • @ugofiasconaro9704
      @ugofiasconaro9704 5 місяців тому

      @@gianlucagiuman6132sinceramente non direi dato che google trova anche artisti emergenti e musica cantata a voce, questi ultimi prima venivano trovati da un altra applicazione "soundhound" ma google funziona bene in entrambe le modalità ed inoltre è già integrato con i cellulari android. Quindi valuta Te.

    • @david_spagarini
      @david_spagarini 5 місяців тому +2

      Specialmente sulle melodie canticchiate/fischiettate. In questo caso, Shazam è praticamente inutile, mentre con Google si ottengono spesso ottimi risultati.

    • @TrioLOLGamers
      @TrioLOLGamers 4 місяці тому +1

      Prova la ricerca audio di google: la aggiungi come Widget o alternativamente chiedi a Google "che canzone è questa". Ti dà anche il tasso di riconoscimento.
      Volendo puoi anche cantarla... Io sono uscito da un concerto di Marcus Miller, ho cantato la canzone e l'ha riconosciuta
      Shazam da quando l'ha comprato Apple, è peggiorato... Risparmieranno sui server... Chissà...

  • @Emaloni
    @Emaloni 4 місяці тому +1

    Spiegazione assurda e affascinante, la grande pecca di shazam a pare mio consiste nel fatto che non riesce a riconoscere il brano quando viene manipolato anche in maniera minima, ad esempio quando il brano viene velocizzato o quando viene messo all'interno di remix ad esempio, magari chissà con l'intelligenza artificiale riusciranno a fare anche questo, inoltre segnalo la presenza dell'app di soundhound il quale non si limita a riconoscere la canzone da una traccia audio standard come shazam ma riesce a rintracciare anche la canzone tramite il nostro canticchiamento della sola melodia, per quanto il processo immagino sia simile a quello di shazam sarebbe interessante sapere anche cosa c'è dietro soundhound che farà sicuramente un lavoro piu complesso

  • @NunzioRaciti
    @NunzioRaciti 5 місяців тому +6

    Affascinante. Grazie del video

  • @tommasobanfi8133
    @tommasobanfi8133 4 місяці тому

    wow! Estremamente chiaro e conciso

  • @TrioLOLGamers
    @TrioLOLGamers 4 місяці тому +7

    Non è pienamente corretto, un segnale audio non è descritto dalla frequenza e dal tempo, ma dalla sua intensità per tempo. La frequenza è un parametro che nasce con la trasformata di Fourier (FFT etc.). Quello che abbiamo noi di dato è (mi perdoni prof.) una forma di sinusoide che si muove attorno allo 0 e arriva a minimo -1 e massimo +1 (il motivo per cui un suono può essere in CONTROFASE con un altro, è che può assumere valori negativi sia nella realtà che un digitale)

    • @marcopaparelli19
      @marcopaparelli19 4 місяці тому

      Hai tutti e quattro i valori: ampiezza, fase, frequenza e tempo. Per tempo lui intende in quale dato momento si trova quel punto.

    • @TrioLOLGamers
      @TrioLOLGamers 4 місяці тому +1

      @@marcopaparelli19 perdonami, ma non ricordo bene cosa ha detto lui nel video (è passato del tempo), ma so cosa è quella rappresentazione. È la sua spiegazione che è errata (o meglio, mancante di basi di Segnali e acustica)

    • @cuevable
      @cuevable 4 місяці тому

      Stai facendo un po' di confusione, se parli di acustica la sinusoide è solo un modo di rappresentare le fasi di compressione e rarefazione delle molecole d'aria generate dalla vibrazione iniziale, due segnali non sono in fase tra di loro quando uno sta svolgendo la parte positiva del ciclo ( compressione ) e l' altro la parte negativa ( rarefazione )... La controfase vera e propria si ottiene duplicando un segnale e invertendo la polarità della copia risultando in un annullamento ed è possibile solo elettronicamente o digitalmente.

    • @cuevable
      @cuevable 4 місяці тому +1

      Ah e la frequenza è semplicemente il numero di cicli che una onda compie in un secondo, la trasformata di Fourier ci dà la risposta in frequenza che in soldoni scompone suoni complessi in una serie di toni puri o sinusoidi che variano di intensità nel tempo

    • @TrioLOLGamers
      @TrioLOLGamers 4 місяці тому

      @@cuevable si, esatto. Sono tutti concetti giusti quelli che dici. Il problema è che nel video vengono ignorati questi concetti base. Nel commento iniziale ho dovuto semplificare e saltare alcuni passaggi riferendomi solo al dominio digitale, non analogico o reale.

  • @MrDoctor_channel
    @MrDoctor_channel 5 місяців тому +2

    Video molto interessante. Approfitto per chiedere una cosa, ma e' una sensazione mia o shazam negli ultimi 2/3 anni funziona molto peggio? molto piu' lento e sbaglia piu' volte. a cosa puo' essere dovuto? E' solo una percezione mia ?

  • @Br3Br2Br1
    @Br3Br2Br1 5 місяців тому +2

    prima volta che vi devo!.....ottimo video e spiegazione!

    • @datapizza
      @datapizza  5 місяців тому +1

      Buona la prima allora! 🤣
      Scherzi a parte grazie mille :)

  • @maurosky0081
    @maurosky0081 4 місяці тому

    il p.s. finale spiega che , non si poteva spiegare in 4,38 minuti, quindi ottima spiegazione.

  • @annamangiaracina9885
    @annamangiaracina9885 5 місяців тому +2

    Veramente interessante! Grazie!

    • @datapizza
      @datapizza  5 місяців тому

      Ne siamo super contenti e grazie a te per i complimenti!

  • @JonathanLazzareschi20
    @JonathanLazzareschi20 5 місяців тому +3

    In base a che cosa vengono scelti i target point? Sono un numero fissato di punti immediatamente successivi?

    • @datapizza
      @datapizza  5 місяців тому +3

      Ciao! Purtroppo nel paper originale non vengono dati dettagli su come vengono effettivamente scelti i target point quindi non sapremmo dirti :(

    • @JonathanLazzareschi20
      @JonathanLazzareschi20 5 місяців тому +1

      @@datapizza ah ok, comunque complimenti per il video, ero sempre stato curioso di come funzionasse questa magia😁

  • @AlessandroBottoni
    @AlessandroBottoni 5 місяців тому +1

    Gran bel video, complimenti! Mi sono appena scaricato il paper. Stanotte me lo leggo...

  • @mirkoturco
    @mirkoturco 5 місяців тому +2

    INTERESSANTE!

  • @riccardotrombetti6663
    @riccardotrombetti6663 5 місяців тому +1

    Molto interessante, fantastici come sempre

    • @datapizza
      @datapizza  5 місяців тому

      Grazie mille! :)

  • @cesagtimk7313
    @cesagtimk7313 4 місяці тому +1

    Non hai specificato che, in fase di release di un brano, la label sceglie se ''rendere visibile'' quella determinata canzone su Shazam perchè senza questo non riconoscerà mai il brano.

  • @staticalmo
    @staticalmo 5 місяців тому +3

    Momento nostalgia fulminante vedendo il sito del 2002

  • @giovannisardisco4541
    @giovannisardisco4541 5 місяців тому +5

    Domanda: esiste una implementazione opensource di questo algoritmo?
    La mia Idea sarebbe quella di usarlo in locale, per individuare 2 file contengono lo stesso brano.

    • @datapizza
      @datapizza  5 місяців тому +4

      Ciao Giovanni! Su GitHub si possono trovare varie implementazioni, tipo queste:
      github.com/bmoquist/Shazam
      github.com/peacecwz/shazam-demo

    • @giovannisardisco4541
      @giovannisardisco4541 5 місяців тому +1

      @@datapizza ❤️ Grazie.
      Voi ne avete provato qualcuno? Vedo che è roba un po' vecchiotta (Python 2)

  • @giutapeful
    @giutapeful 5 місяців тому +1

    Bellissimo, grazie!

  • @officialle
    @officialle 4 місяці тому

    potresti spiegare come fa il now playing dei Google Pixel visto che funziona offline?

  • @FM-iw9cp
    @FM-iw9cp 5 місяців тому +17

    E ci sono persone che ancora credono che cantando o suonando una canzone qualsiasi Shazam possa riconoscerla 😂

    • @Dalfi91
      @Dalfi91 4 місяці тому +11

      La ricerca vocale di Google ci riesce

    • @cristianlivella
      @cristianlivella 4 місяці тому

      ​@@Dalfi91e con molta accuratezza, mi ha trovato senza problemi canzoni fischiettate appositamente male. Peccato che non molte persone la conoscono, ed è meno intuitiva da utilizzare rispetto a Shazam, che è un'app apposita con un pulsante apposito. Il giorno che la ricerca di Google diventerà più popolare, sarà la fine per Shazam.

    • @75davide47
      @75davide47 4 місяці тому +1

      ​@@Dalfi91 a te funziona ancora in questo momento? A me non funziona più, forse devo resettare...

    • @stxyzlf
      @stxyzlf 4 місяці тому

      ​@@75davide47 Devi usare proprio l'app Google, non c'è sull'app Chrome

  • @craigjones5939
    @craigjones5939 5 місяців тому +2

    Ah quindi mi stai dicendo che non è grazie alla miriade di cloni di Tiramisù, imprigionati dall'azienda?

  • @rm9050
    @rm9050 5 місяців тому +3

    Ma quindi non viene impiegata la trasformata di Fourier per rendere il segnale più gestibile?

    • @mtusa23
      @mtusa23 5 місяців тому

      Sembra più ricerca operativa. Quindi un problema di programmazione lineare..quindi afferenze tra nodi e percorsi..e da lì machine learning

    • @appaio
      @appaio 5 місяців тому +8

      lo spettrogramma non si fa da solo e la trasformata di fourier è ovviamente il fondamento. Chi dice qui nei commenti che ha tutto super chiaro non ha la più pallida idea 😂 quando ho letto il tipo che si vuole leggere il paper sono rotolato dalle risate. Teoria dei segnali! altro che ricerca operativa. parole a casaccio.,…..ehhhh Tra parentesi dire che il bianco sullo spettrogramma sia maggiore intensità del segnale su quella banda in contrasto al nero.. hai i colori al contrario devo supporre. Un video fatto da chi non ha capito un h di quello che sta dicendo e seguito da persone che fanno finta. Quell’altro che invece di scrivere su google chiede qua cose di cui non ha idea. tutto molto cringe.

    • @mtusa23
      @mtusa23 5 місяців тому

      @@appaio una cosa è trovare/calcolare le informazioni che servono , tramite processi matematici da te descritti.. una cosa e dare a questi un senso una forma ed una relazione tra di loro. A parere mio sono 2 ,dei diversi aspetti, fondamentali alla base di questo" problema.." . Percui la tua affermazione ritengo sia corretta , almeno quanto la mia. Detto questo relax...keep and calm! Che qui nessuno deve dimostrare niente a nessuno ..

    • @appaio
      @appaio 5 місяців тому +1

      @@mtusa23 da ingegnere mi ha stunnato come si usa dire ultimamente. Non saprei proprio come spiegare il funzionamento del matching senza entrare nel dettaglio che stiamo campionando finestre temporali del brano. Però a parte tutto mi fanno ridere le risposte degli utenti che veramente credono di averlo capito! Non l’hanno capito. Tutto qua. Quello del paper proprio era l’apoteosi. Se non conosci le basi non puoi pretendere di leggere un paper e capirlo. E insomma superata una certa soglia poi si aprono gli argini e la critica diventa inopportuna. Ma ormai

    • @TrioLOLGamers
      @TrioLOLGamers 4 місяці тому

      ​@@appaioquoto (Ps. Laureato in inf. Musicale)

  • @giangiorgio.mp3
    @giangiorgio.mp3 4 місяці тому

    L'informazione dello spettrogramma viene ricavata da quella del segnale audio tramite una trasformata. Oltre alle intensità vengono ricavate anche le fasi, che nello spettrogramma non vengono mostrate.

  • @ldmldm3810
    @ldmldm3810 5 місяців тому

    Ma Shasamm riconosce anche i brani di Giggi di Alessia ?

  • @supermassiveblckman
    @supermassiveblckman 5 місяців тому

    La domanda invece è: perchè shazam ci mette molto più tempo e fallisce più che, per esempio, rispetto al 2012 (quando l'ho usato per la prima volta)???

  • @marcelloleanza2608
    @marcelloleanza2608 5 місяців тому

    Bravo

  • @sergiopalmieri5930
    @sergiopalmieri5930 5 місяців тому +2

    Io convinto che l'avesse creata UomoGatto

  • @Voiin
    @Voiin 5 місяців тому

    Shazam!

  • @davidedavide2623
    @davidedavide2623 5 місяців тому +1

    Come hanno fatto a caricare i dati di migliaia di brani già dal 2002?

    • @antoniobertolini9358
      @antoniobertolini9358 5 місяців тому +1

      Probabilmente lo spettogramma occupa pochissima memoria in rapporto ad un brano

    • @davidedavide2623
      @davidedavide2623 5 місяців тому +1

      Mmh ok, ma il quesito era per capire come materialmente avessero fatto ad ottenere i dati delle canzoni, dato che la musica era fisica e non digitale come oggi e quindi in che modo sono potuti entrare in possesso di migliaia di canzoni

    • @antoniobertolini9358
      @antoniobertolini9358 5 місяців тому

      @@davidedavide2623 sicuramente é fattibile, ma non ho idea di come effettivamente 🤣

    • @Uomo-ratto
      @Uomo-ratto 5 місяців тому

      @@davidedavide2623anche i CD wav sono digitali. Esistono dal 1980.

  • @vincitek5826
    @vincitek5826 5 місяців тому +3

    Ultimamente sbaglia abbastanza, in passato era più preciso.

  • @realista182
    @realista182 5 місяців тому +2

    mi trovo meglio con soundhound

    • @pqdb2942
      @pqdb2942 4 місяці тому +2

      funzionano tutte cosi

  • @bigmoonke
    @bigmoonke 4 місяці тому +1

    Bravo eh, però se copi i video americani almeno fai le props

  • @fabsrd
    @fabsrd 5 місяців тому +3

    Video interessante ma entusiasmo zero... Mamma mia mi ci è voluto per ascoltarti fino alla fine!

  • @HelloVista-Droid
    @HelloVista-Droid 4 місяці тому

    Come Funziona Shazam ?
    Io : Male

  • @lianyf8866
    @lianyf8866 5 місяців тому

    doof