L’ultimo diario di apprendimento automatico di Apple descrive come scopre le emoji popolari e altro ancora


Apple ha condiviso il suo ultimo white paper tramite il suo giornale di apprendimento automatico. La voce di oggi è “Apprendimento con privacy su scala” e copre algoritmi specifici che Apple utilizza con la privacy differenziale per migliorare le caratteristiche del prodotto con alcuni casi d’uso specifici come la scoperta di emoji popolari.

Lanciata l’estate scorsa , Apple ha utilizzato il suo giornale di apprendimento automatico per condividere l’ evoluzione di Siri , come funziona ‘Hey Siri’, il suo rilevamento facciale e altro ancora.

Il documento di oggi condivide i dettagli sull’equilibrio dell’accesso ai dati dell’utente per migliorare i prodotti, mentre utilizza la privacy differenziale locale per proteggere le informazioni degli utenti.

All’interno della struttura della privacy differenziale, ci sono due impostazioni: centrale e locale . Nel nostro sistema, scegliamo di non raccogliere dati grezzi sul server richiesti per la privacy differenziale centrale; quindi, adottiamo la privacy differenziale locale, che è una forma superiore di privacy [3]. La privacy differenziale locale ha il vantaggio che i dati sono randomizzati prima di essere inviati dal dispositivo, quindi il server non vede né riceve mai dati grezzi.
Apple osserva inoltre che il suo sistema è solo opt-in e trasparente, senza dati registrati o inviati prima dell’approvazione dell’utente.

Il documento descrive dettagliatamente l’architettura del sistema che Apple sta utilizzando e gli algoritmi che ha progettato, tra cui uno “Sketch conteggio del conteggio privato”, “Schizzo medio del conteggio Hadamard privato” e un “Puzzle con frammenti di sequenza privata”.

Per quanto riguarda i casi d’uso, Apple nota che è in grado di migliorare i suggerimenti QuickType di emoji predittivi in ​​base alla posizione.

Data la popolarità delle emoji attraverso la nostra base di utenti, vogliamo determinare quali emoji specifici sono più utilizzati dai nostri clienti e la relativa distribuzione di questi personaggi. A tal fine, implementiamo i nostri algoritmi per comprendere la distribuzione degli emoji utilizzati attraverso le impostazioni locali della tastiera. Per questo caso d’uso, impostiamo i parametri per CMS come m m = 1024, k k = 65.536, e ε ε = 4 con dimensione del dizionario di 2600 emoji.

I dati mostrano molte differenze tra le impostazioni locali della tastiera. Nella Figura 6, osserviamo le istantanee di due versioni locali: inglese e francese. Usando questi dati, possiamo migliorare il nostro emoji predittivo QuickType attraverso le impostazioni locali.
Altri casi d’uso includono “Identificazione dell’uso di energia e memoria in Safari” e “Scoperta di nuove parole”.

Lascia un commento