6 progetti di data science open source da provare a casa!!

Contenuti

Panoramica

  • Lavora sulle tue competenze di data science con questi progetti open source
  • Questi progetti di data science open source coprono una vasta gamma di argomenti, dalla visione artificiale all'analisi dei dati web.

introduzione

È stato difficile per te imparare a casa? La maggior parte di noi è sulla stessa barca: ci sono troppe cose da destreggiarsi durante questi tempi tumultuosi e di apprendimento, contrariamente alle nostre aspettative iniziali, è passato in secondo piano.

Quindi, Come possiamo tornare in pista? Come possiamo combinare il nostro apprendimento della scienza dei dati con l'esperienza pratica??

Una cosa fondamentale che mi ha aiutato moltissimo è stata la scelta di un progetto di data science open source e la sua esecuzione. Questo non solo mi aiuta a capire le aree chiave in cui devo migliorare, mi mostra anche la strada da percorrere.

data_science_projects_github-3564080

E questi progetti non sono i tuoi comuni progetti di data science.. Questi sono progetti specifici che affrontano un certo sottocampo della scienza dei dati, come la visione artificiale, analisi web, eccetera. Il progetto potrebbe essere un dataset, una libreria all'avanguardia che ha fatto progredire il campo della scienza dei dati o persino uno strumento di analisi open source.

Perciò, scegli un progetto che ti incuriosisce e inizia a lavorarci oggi.

Puoi controllare il nostro archivio completo di progetti di data science open source qui.

6 progetti di data science open source da provare in questo periodo di blackout

github-6003811

Progetti di visione artificiale open source

Grazie alla potenza di PyTorch, quest'anno stiamo assistendo a molti casi d'uso sorprendenti nello spazio della visione artificiale. Qui, Ho selezionato alcuni eccezionali progetti di visione artificiale che adorerai esplorare e immergerti.

E se sei nuovo in questo campo e vuoi iniziare, dai un'occhiata a queste risorse:

Questo è un caso d'uso squisito per la visione artificiale. La conversione di un'immagine in una foto tridimensionale richiedeva una conoscenza sofisticata e approfondita di strumenti come Photoshop a un certo punto.. Ora, gracias a los avances en el apprendimento profondo y la visión por computadora, Possiamo eseguire questa trasformazione in poche righe di codice!!

Questo progetto, open source su GitHub, fa esattamente questo. Prende una singola immagine di input RGB-D e la converte in una foto 3D. Se preferisci i termini di deep learning, quindi questo è “un rendering multistrato per una nuova sintesi della vista contenente colori allucinati e strutture di profondità in regioni occluse nella vista originale”.

Guarda un esempio di cosa puoi fare con questo framework:

Molto impressionante, verità? Questo progetto, come avrai già intuito, è stato realizzato utilizzando PyTorch. Questo è un framework con cui dovresti iniziare a familiarizzare.:

Questo è un bel progetto secondario su cui lavorare se non hai molto tempo libero. Fa quello che dice sulla scatola: dai al modello un'immagine di input e la trasformerà in una versione cartone animato:

photo_cartoon_open_source_project-4277153

Riuscite a indovinare quale concetto di computer vision c'è dietro questo progetto?? sì, reti generative di confronto (GAN). Sono davvero stupito dai rapidi progressi che abbiamo visto nei GAN da quando è stato aperto nel 2014 alla comunità. Da CycleGAN a StarGAN, non mancano i framework che puoi scegliere e con cui lavorare.

Gli sviluppatori dietro questo progetto da foto a cartone animato hanno aperto un modello pre-addestrato per aiutarti a caricarlo ed eseguirlo rapidamente sulla tua macchina.. Ho già visto alcuni tentativi in ​​questo senso, ma questa è la trasformazione più realistica che ho incontrato.

Prossimo, vengono mostrate alcune risorse per aiutarti a comprendere i GAN:

I frame di rilevamento degli oggetti hanno registrato notevoli progressi negli ultimi anni. Siamo passati dalla generazione di semplici riquadri di delimitazione nelle immagini fisse al monitoraggio di oggetti dinamici nei video. Questo è il potere della visione artificiale.

tuttavia, i progressi nel riunire i concetti di rilevamento e reidentificazione degli oggetti sono stati lenti (per non dire altro!). In questo affascinante studio, i ricercatori presentano una semplice linea di base per colmare questa lacuna tracciando più oggetti in un unico scatto.

Guarda il tuo modello in azione:

multi_object_detection_open_source-3230494

Il modello di base che hanno ottenuto dall'open source supera lo stato dell'arte nei set di dati pubblici in 30 fps. Puoi trovare sia il codice che l'articolo di ricerca nel link che ho menzionato sopra.

Ti consiglio di seguire i seguenti tutorial se stai cercando di imparare a rilevare gli oggetti:

Altri fantastici progetti di data science open source

Ho selezionato un elenco di vari progetti di data science open source qui, dalla generazione audio all'analisi sportiva. Prova il tuo preferito e goditi l'esperienza di apprendimento!

Ho cliccato su questo progetto non appena ho visto OpenAI nel titolo. Sono un grande ammiratore del tuo lavoro e apprezzo la tua posizione sui principali sviluppi dell'open source per la più ampia comunità di data science. Chi non ama GPT-2?

Juke-box, come gli appassionati di musica capiranno intuitivamente, es un modelo de neuronale rosso que genera música cantando en el dominio de audio sin procesar. OpenAI ha aperto i pesi e il codice modello, insieme a uno strumento per esplorare i campioni generati.

auto-music-3228954

Ecco come funziona Jukebox: forniamo il genere, l'artista e il testo come input, e la rete neurale ci regala un nuovo campione di musica prodotta da zero. La gamma di musica che Jukebox può generare è sbalorditiva. È un progetto affascinante su cui lavorare!!

Posso vedere (e ascolta) Jukebox in azione a Il sito OpenAI. E puoi anche consultare gli articoli di DataPeaker su come lavorare con i dati audio:

Utilizzi strumenti di analisi web come Google Analytics per monitorare le prestazioni del tuo sito?? Il problema con questi strumenti è che non c'è privacy per la tua organizzazione. Cosa c'è di più, potresti dover sborsare dei soldi se vuoi le funzionalità premium. Quindi, non è l'ideale per tutti.

Queste sono le principali lacune che ShyNet mira a colmare. Ecco come l'hanno messa gli sviluppatori:

“Ospitalo tu stesso, quindi i dati sono il vostro. Funziona senza cookie, quindi non hai bisogno di avvisi invadenti sui cookie. Raccogli solo dati sufficienti per essere utile, ma non abbastanza per essere inquietante. È open source e destinato a essere ospitato autonomamente. E potresti anche trovare l'interfaccia facile da usare “.

Ecco uno screenshot di esempio della homepage predefinita di ShyNet:

shynet_web_analytics_open_source_project-4151548

E se ti stai chiedendo quali metriche chiave può darti ShyNet, la tua attesa è finita:

  • Colpi
  • sessioni
  • Tempo di caricamento della pagina
  • Frequenza di rimbalzo
  • Durata
  • Mittenti
  • Sedi
  • Sistema operativo
  • Browser
  • Posizione geografica e rete
  • Tipo di dispositivo

Tenga en cuenta que ShyNet en su formato actual es excelente si tiene una pequeña o mediano azienda. Potrebbe non essere l'ideale da usare se sei in una grande azienda. Il repository GitHub che ho collegato sopra contiene un riepilogo completo di come funziona ShyNet e come puoi iniziare a usarlo.

Consiglio di seguire la guida dettagliata di seguito per conoscere il mondo del marketing digitale (del cual forma parte la analitico ragnatela):

Questo è il mio preferito. Sono un grande appassionato di calcio e mi sono addentrato nel mondo dell'analisi sportiva per un po' di tempo. I progressi in questo campo sono stati molto più lenti rispetto ad altri settori, ma negli ultimi anni, team e franchise si stanno rendendo conto della potenza dell'analisi e della scienza dei dati.

Gli sport americani sono molto più avanti di altri paesi in termini di progresso e adattabilità, ma le squadre di calcio europee stanno finalmente iniziando a giocare a palla. Liverpool, ad esempio, se basa en gran misura en un enfoque basado en datos de arriba a abajo, inclusa la pianificazione della strategia di reclutamento.

Quindi, se sei un fanatico dello sport e vuoi avventurarti nel mondo dell'analisi, questo è il progetto open source perfetto per te.

football_analytics_open_source_project-5635158

Il repository GitHub contiene una vasta gamma di risorse per iniziare, Compreso:

  • Risorse e suggerimenti sulle competenze tecniche utili per il lavoro di analisi del calcio.
  • Una raccolta di tutorial Python che mostrano come lavorare con i set di dati sul calcio.
  • Articoli di ricerca e articoli sugli sviluppi all'avanguardia nell'analisi del calcio.

Note finali

Quindi, A quale progetto di data science open source lavorerai a maggio?? Ho cercato di coprire una vasta gamma di domini qui che offrono una grande varietà di opzioni per te. Personalmente, Sono molto entusiasta di immergermi nel progetto del manuale di analisi del calcio e vedere come posso ampliare le mie conoscenze sull'argomento.

Se hai altri progetti open source da condividere con noi, sentiti libero di mettere il nome e il link nella sezione commenti qui sotto. Rendiamo questo un mese di apprendimento super produttivo!!

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.