Panoramica
- Lavora sulle tue competenze di data science con questi progetti open source
- Questi progetti di data science open source coprono una vasta gamma di argomenti, dalla visione artificiale all'analisi dei dati web.
introduzione
È stato difficile per te imparare a casa? La maggior parte di noi è sulla stessa barca: ci sono troppe cose da destreggiarsi durante questi tempi tumultuosi e di apprendimento, contrariamente alle nostre aspettative iniziali, è passato in secondo piano.
Quindi, Come possiamo tornare in pista? Come possiamo combinare il nostro apprendimento della scienza dei dati con l'esperienza pratica??
Una cosa fondamentale che mi ha aiutato moltissimo è stata la scelta di un progetto di data science open source e la sua esecuzione. Questo non solo mi aiuta a capire le aree chiave in cui devo migliorare, mi mostra anche la strada da percorrere.
E questi progetti non sono i tuoi comuni progetti di data science.. Questi sono progetti specifici che affrontano un certo sottocampo della scienza dei dati, come la visione artificiale, analisi web, eccetera. Il progetto potrebbe essere un dataset, una libreria all'avanguardia che ha fatto progredire il campo della scienza dei dati o persino uno strumento di analisi open source.
Perciò, scegli un progetto che ti incuriosisce e inizia a lavorarci oggi.
Puoi controllare il nostro archivio completo di progetti di data science open source qui.
6 progetti di data science open source da provare in questo periodo di blackout
Progetti di visione artificiale open source
Grazie alla potenza di PyTorch, quest'anno stiamo assistendo a molti casi d'uso sorprendenti nello spazio della visione artificiale. Qui, Ho selezionato alcuni eccezionali progetti di visione artificiale che adorerai esplorare e immergerti.
E se sei nuovo in questo campo e vuoi iniziare, dai un'occhiata a queste risorse:
Questo è un caso d'uso squisito per la visione artificiale. La conversione di un'immagine in una foto tridimensionale richiedeva una conoscenza sofisticata e approfondita di strumenti come Photoshop a un certo punto.. Ora, gracias a los avances en el apprendimento profondoApprendimento profondo, Una sottodisciplina dell'intelligenza artificiale, si affida a reti neurali artificiali per analizzare ed elaborare grandi volumi di dati. Questa tecnica consente alle macchine di apprendere modelli ed eseguire compiti complessi, come il riconoscimento vocale e la visione artificiale. La sua capacità di migliorare continuamente man mano che vengono forniti più dati lo rende uno strumento chiave in vari settori, dalla salute... y la visión por computadora, Possiamo eseguire questa trasformazione in poche righe di codice!!
Questo progetto, open source su GitHub, fa esattamente questo. Prende una singola immagine di input RGB-D e la converte in una foto 3D. Se preferisci i termini di deep learning, quindi questo è “un rendering multistrato per una nuova sintesi della vista contenente colori allucinati e strutture di profondità in regioni occluse nella vista originale”.
Guarda un esempio di cosa puoi fare con questo framework:
Molto impressionante, verità? Questo progetto, come avrai già intuito, è stato realizzato utilizzando PyTorch. Questo è un framework con cui dovresti iniziare a familiarizzare.:
Questo è un bel progetto secondario su cui lavorare se non hai molto tempo libero. Fa quello che dice sulla scatola: dai al modello un'immagine di input e la trasformerà in una versione cartone animato:
Riuscite a indovinare quale concetto di computer vision c'è dietro questo progetto?? sì, reti generative di confronto (GAN). Sono davvero stupito dai rapidi progressi che abbiamo visto nei GAN da quando è stato aperto nel 2014 alla comunità. Da CycleGAN a StarGAN, non mancano i framework che puoi scegliere e con cui lavorare.
Gli sviluppatori dietro questo progetto da foto a cartone animato hanno aperto un modello pre-addestrato per aiutarti a caricarlo ed eseguirlo rapidamente sulla tua macchina.. Ho già visto alcuni tentativi in questo senso, ma questa è la trasformazione più realistica che ho incontrato.
Prossimo, vengono mostrate alcune risorse per aiutarti a comprendere i GAN:
I frame di rilevamento degli oggetti hanno registrato notevoli progressi negli ultimi anni. Siamo passati dalla generazione di semplici riquadri di delimitazione nelle immagini fisse al monitoraggio di oggetti dinamici nei video. Questo è il potere della visione artificiale.
tuttavia, i progressi nel riunire i concetti di rilevamento e reidentificazione degli oggetti sono stati lenti (per non dire altro!). In questo affascinante studio, i ricercatori presentano una semplice linea di base per colmare questa lacuna tracciando più oggetti in un unico scatto.
Guarda il tuo modello in azione:
Il modello di base che hanno ottenuto dall'open source supera lo stato dell'arte nei set di dati pubblici in 30 fps. Puoi trovare sia il codice che l'articolo di ricerca nel link che ho menzionato sopra.
Ti consiglio di seguire i seguenti tutorial se stai cercando di imparare a rilevare gli oggetti:
Altri fantastici progetti di data science open source
Ho selezionato un elenco di vari progetti di data science open source qui, dalla generazione audio all'analisi sportiva. Prova il tuo preferito e goditi l'esperienza di apprendimento!
Ho cliccato su questo progetto non appena ho visto OpenAI nel titolo. Sono un grande ammiratore del tuo lavoro e apprezzo la tua posizione sui principali sviluppi dell'open source per la più ampia comunità di data science. Chi non ama GPT-2?
Juke-box, come gli appassionati di musica capiranno intuitivamente, es un modelo de neuronale rossoLe reti neurali sono modelli computazionali ispirati al funzionamento del cervello umano. Usano strutture note come neuroni artificiali per elaborare e apprendere dai dati. Queste reti sono fondamentali nel campo dell'intelligenza artificiale, consentendo progressi significativi in attività come il riconoscimento delle immagini, Elaborazione del linguaggio naturale e previsione delle serie temporali, tra gli altri. La loro capacità di apprendere schemi complessi li rende strumenti potenti.. que genera música cantando en el dominio de audio sin procesar. OpenAI ha aperto i pesi e il codice modello, insieme a uno strumento per esplorare i campioni generati.
Ecco come funziona Jukebox: forniamo il genere, l'artista e il testo come input, e la rete neurale ci regala un nuovo campione di musica prodotta da zero. La gamma di musica che Jukebox può generare è sbalorditiva. È un progetto affascinante su cui lavorare!!
Posso vedere (e ascolta) Jukebox in azione a Il sito OpenAI. E puoi anche consultare gli articoli di DataPeaker su come lavorare con i dati audio:
Utilizzi strumenti di analisi web come Google Analytics per monitorare le prestazioni del tuo sito?? Il problema con questi strumenti è che non c'è privacy per la tua organizzazione. Cosa c'è di più, potresti dover sborsare dei soldi se vuoi le funzionalità premium. Quindi, non è l'ideale per tutti.
Queste sono le principali lacune che ShyNet mira a colmare. Ecco come l'hanno messa gli sviluppatori:
“Ospitalo tu stesso, quindi i dati sono il vostro. Funziona senza cookie, quindi non hai bisogno di avvisi invadenti sui cookie. Raccogli solo dati sufficienti per essere utile, ma non abbastanza per essere inquietante. È open source e destinato a essere ospitato autonomamente. E potresti anche trovare l'interfaccia facile da usare “.
Ecco uno screenshot di esempio della homepage predefinita di ShyNet:
E se ti stai chiedendo quali metriche chiave può darti ShyNet, la tua attesa è finita:
- Colpi
- sessioni
- Tempo di caricamento della pagina
- Frequenza di rimbalzo
- Durata
- Mittenti
- Sedi
- Sistema operativo
- Browser
- Posizione geografica e rete
- Tipo di dispositivo
Tenga en cuenta que ShyNet en su formato actual es excelente si tiene una pequeña o medianoLa mediana è una misura statistica che rappresenta il valore centrale di un insieme di dati ordinati. Per calcolarlo, I dati sono organizzati dal più basso al più alto e viene identificato il numero al centro. Se c'è un numero pari di osservazioni, I due valori fondamentali sono mediati. Questo indicatore è particolarmente utile nelle distribuzioni asimmetriche, poiché non è influenzato da valori estremi.... azienda. Potrebbe non essere l'ideale da usare se sei in una grande azienda. Il repository GitHub che ho collegato sopra contiene un riepilogo completo di come funziona ShyNet e come puoi iniziare a usarlo.
Consiglio di seguire la guida dettagliata di seguito per conoscere il mondo del marketing digitale (del cual forma parte la analiticoL'analisi si riferisce al processo di raccolta, Misura e analizza i dati per ottenere informazioni preziose che facilitano il processo decisionale. In vari campi, come business, Salute e sport, L'analisi può identificare modelli e tendenze, Ottimizza i processi e migliora i risultati. L'utilizzo di strumenti avanzati e tecniche statistiche è fondamentale per trasformare i dati in conoscenze applicabili e strategiche.... ragnatela):
Questo è il mio preferito. Sono un grande appassionato di calcio e mi sono addentrato nel mondo dell'analisi sportiva per un po' di tempo. I progressi in questo campo sono stati molto più lenti rispetto ad altri settori, ma negli ultimi anni, team e franchise si stanno rendendo conto della potenza dell'analisi e della scienza dei dati.
Gli sport americani sono molto più avanti di altri paesi in termini di progresso e adattabilità, ma le squadre di calcio europee stanno finalmente iniziando a giocare a palla. Liverpool, ad esempio, se basa en gran misuraIl "misura" È un concetto fondamentale in diverse discipline, che si riferisce al processo di quantificazione delle caratteristiche o delle grandezze degli oggetti, fenomeni o situazioni. In matematica, Utilizzato per determinare le lunghezze, Aree e volumi, mentre nelle scienze sociali può riferirsi alla valutazione di variabili qualitative e quantitative. L'accuratezza della misurazione è fondamentale per ottenere risultati affidabili e validi in qualsiasi ricerca o applicazione pratica.... en un enfoque basado en datos de arriba a abajo, inclusa la pianificazione della strategia di reclutamento.
Quindi, se sei un fanatico dello sport e vuoi avventurarti nel mondo dell'analisi, questo è il progetto open source perfetto per te.
Il repository GitHub contiene una vasta gamma di risorse per iniziare, Compreso:
- Risorse e suggerimenti sulle competenze tecniche utili per il lavoro di analisi del calcio.
- Una raccolta di tutorial Python che mostrano come lavorare con i set di dati sul calcio.
- Articoli di ricerca e articoli sugli sviluppi all'avanguardia nell'analisi del calcio.
Note finali
Quindi, A quale progetto di data science open source lavorerai a maggio?? Ho cercato di coprire una vasta gamma di domini qui che offrono una grande varietà di opzioni per te. Personalmente, Sono molto entusiasta di immergermi nel progetto del manuale di analisi del calcio e vedere come posso ampliare le mie conoscenze sull'argomento.
Se hai altri progetti open source da condividere con noi, sentiti libero di mettere il nome e il link nella sezione commenti qui sotto. Rendiamo questo un mese di apprendimento super produttivo!!