Visión general
- Amazon Web Services (AWS) es la plataforma en la nube líder para implementar soluciones de aprendizaje automático
- Todo profesional de la ciencia de datos debe aprender cómo funciona AWS
Introducción
«Su máquina se quedó sin memoria».
¿Suena familiar? Ciertamente lo es para mí, especialmente cada vez que intento ejecutar un algoritmo complejo de aprendizaje automático en mi máquina personal. Es una experiencia bastante frustrante que sienten muchos profesionales de la ciencia de datos. No tenemos la potencia informática ilimitada de los gigantes de la tecnología, entonces, ¿qué debemos hacer?
Aquí es donde el poder de la nube ha transformado la ciencia de datos. Y Amazon, con su oferta de AWS, ha conquistado el mercado de la ciencia de datos como nunca antes.
La computación en la nube ha experimentado un tremendo crecimiento en los últimos años. Casi todas las organizaciones hoy en día utilizan la computación en la nube para su amplia gama de servicios. Se espera que el 70% de todo el dinero gastado en tecnología se destine a servicios en la nube para fines de 2020.
¿Sabía que los ingresos de AWS en el primer trimestre de 2020 fueron de $ 10 mil millones? ¡Eso es casi el doble que su próximo competidor más cercano! Todo profesional de la ciencia de datos, desde una ciencia de datos hasta un analista de datos, necesita aprender AWS y saber cómo funciona.
Entonces, en este artículo, profundicemos en lo que es AWS y descubramos por qué está a la vanguardia de los servicios de computación en la nube.
Tabla de contenido
- ¿Qué es Amazon Web Services (AWS)?
- Historia de los servicios web de Amazon
- Servicios proporcionados por Amazon Web Services
- He aquí por qué no puede usar su sistema local para todas sus tareas de datos
- ¿Cómo puede ayudarlo Amazon Web Services?
¿Qué es Amazon Web Services (AWS)?
AWS es una plataforma de computación en la nube de Amazon que brinda servicios como Infraestructura como servicio (IaaSLa Infraestructura como Servicio (IaaS) es un modelo de computación en la nube que proporciona recursos informáticos virtualizados a través de Internet. Permite a las empresas acceder a servidores, almacenamiento y redes sin necesidad de invertir en hardware físico. Esto ofrece flexibilidad y escalabilidad, permitiendo a los usuarios ajustar los recursos según sus necesidades. IaaS es ideal para startups y empresas que buscan optimizar costos y mejorar su capacidad operativa....), plataforma como servicio (PaaS) y software empaquetado como servicio (SaaS) según el sistema de pago por uso. Se lanzó en 2006, pero originalmente se usó para manejar las operaciones minoristas en línea de Amazon.
AWS tiene 3 productos principales:
- EC2 (Amazon Elastic Compute Cloud):
EC2 permite a los usuarios alquilar máquinas / servidores virtuales en los que ejecutan sus propias aplicaciones. Estos servidores vienen en diferentes sistemas operativos y Amazon le cobra en función de la potencia informática y la capacidad del servidor (es decir, la capacidad del disco duro, CPU, memoria, etc.) y la duración del servidor. - glaciar
Glacier es un servicio web de almacenamiento de archivos en línea de bajo costo. Amazon Glacier está diseñado para el almacenamiento a largo plazo de datos inactivos que no necesitarán recuperarse rápidamente. - S3 (Servicios de almacenamiento simple de Amazon)
S3 proporciona almacenamiento de objetos a través de una interfaz de servicio web, con la escalabilidad y la alta velocidad como ventaja.
AWS ofrece a sus consumidores muchas ventajas:
- Seguridad: AWS proporciona capacidades de seguridad integrales para garantizar los requisitos más exigentes.
- Cumplimiento: AWS tiene amplios controles, auditorías y una amplia acreditación de seguridad.
- Hibridismo: permite la construcción de arquitecturas híbridas que extienden la infraestructura local a la nube.
- Escalabilidad: permite escalar hacia arriba y hacia abajo con facilidad
- Pago por uso: esto significa que paga de acuerdo con los servicios que utiliza. Inútil, paga menos. Use más, pague más, pero el precio unitario baja a medida que aumenta la escala
Aquí hay un artículo que lo ayudará a comenzar su viaje en el uso de AWS:
Historia de Amazon Web Services (AWS)
AWS se lanzó inicialmente en 2002, pero solo proporcionó algunos servicios. En 2006, AWS lanzó sus productos en la nube que incluían almacenamiento en la nube Amazon S3, SQS (Simple Queue Service) y EC2 y, al hacerlo, marcó su entrada en la industria de servicios centrales en línea.
En 2009, AWS vio la expansión internacional de AWS a Europa, donde se lanzaron S3 y EC2. Elastic Block Store (EBS), que proporciona almacenamiento a nivel de bloque, y Amazon CloudFront, una red de entrega de contenido, se lanzaron e incorporaron a AWS.
Proporciona almacenamiento a nivel de bloque para usar con instancias Amazon EC2. Los volúmenes de Amazon Elastic Block Store están conectados a la red y son independientes de la vida útil de una instancia.
A lo largo de los años, se agregaron muchos servicios a la plataforma AWS, lo que la ha convertido en una plataforma rentable y altamente escalable. Ahora, AWS tiene sus centros de datos en todo el mundo, incluidos Estados Unidos, Japón, Europa, Australia y Brasil.
Mapa de infraestructura global de AWS
Servicios proporcionados por Amazon Web Services
AWS proporciona los siguientes servicios en los dominios respectivos:
- Servicios informáticos:
- EC2 (Elastic Compute Cloud)
- EKS (servicio de contenedor elástico para Kubernetes)
- Lambda
- Amazon LightSail
- Tallo de frijol elástico
- Servicios de base de datos:
- Neptuno
- RDS
- Aurora
- RedShift
- DynamoDB
- ElastiCache
- Servicios de seguridad:
- KMS (servicio de gestión de claves)
- AWS IAM (administración de identidades y accesos)
- Inspector
- WAF (firewall de aplicaciones web)
- Directorio en la nube
- Gerente de certificado
- Organizaciones
- Blindaje
- Macie
- Guardia
- Servicios de almacenamiento:
- Glaciar Amazonas
- S3 (servicio de almacenamiento simple)
- AWS Snowball
- Tienda de bloques elásticos
- Servicios de migración:
- Bola de nieve
- DMS (Servicio de migración de bases de datos)
- SMS (Servicio de migración de servidor)
- Servicios analíticos:
- Kinesis
- QuickSight EMR (reducción de mapa elástico)
- Canalización de datos
- CloudSearch
- Atenea
- ElasticSearch
- Herramientas administrativas:
- CloudWatch
- CloudFormation
- CloudTrail
- OpsWorks
- Config
- Escalado automático de AWS
- Servicios de mensajería:
Para obtener más información sobre los servicios proporcionados por AWS, haga clic aquí.
A estas alturas, tendrá un amplio conocimiento de lo que es AWS. Entonces, arrojemos algo de luz sobre por qué las empresas requieren que sus científicos de datos conozcan AWS.
He aquí por qué no puede usar su sistema local para todas sus tareas de datos
¿Recuerda cuando estaba sentado inactivo esperando que el sistema respondiera? A continuación, destacamos una lista de problemas que sus sistemas locales deben poder superar:
- El sistema en el que implementas tareas tiene un bajo poder de procesamiento que afectará tu puntualidad. Debe haber notado esto mientras procesaba grandes volúmenes de datos y estoy bastante seguro de que los pensamientos de un sistema externo administrado centralmente deben haber cruzado por su mente.
- Los conjuntos de datos grandes no caben en la memoria del sistema del IDE, que es necesaria para el análisis o el entrenamiento de modelos. ¿Recuerda cuando su cuaderno Jupyter se atascó?
- Cuesta mucho tanto en términos de tiempo como de dinero instalar y mantener su propio hardware
¿Cómo puede ayudarlo Amazon Web Services?
Estoy seguro de que muchos de ustedes todavía se estarán preguntando por qué debería usar AWS. ¿Por qué no optar por otra cosa (como el GCP de Google)? Permítame responder a esto brindando los siguientes beneficios para AWS:
Fácil de usar
AWS tiene una interfaz de usuario muy bien documentada que erradica el requisito de servidores en el sitio para satisfacer las demandas de TI. Esto facilita la implementación de programas, software de vez en cuando. AWS satisface todas sus necesidades.
Diversas herramientas
Anteriormente en este artículo, vimos la diversa gama de servicios que AWS tiene para ofrecer. Es la solución todo en uno para sus requisitos de TI y nube, considerando su eficiencia.
Capacidad de Computación
No necesita preocuparse por si grandes conjuntos de datos cabrán en la memoria del sistema de su IDE o no.
Infraestructura
AWS Global Cloud Infrastructure es la plataforma en la nube más extensa y confiable, que ofrece más de 175 servicios con todas las funciones de los centros de datos a nivel mundial. Ya sea que necesite implementar las cargas de trabajo de sus aplicaciones en todo el mundo con un solo clic o si desea crear e implementar aplicaciones específicas más cerca de sus usuarios finales con una latencia de milisegundos de un solo dígito, AWS le brinda la infraestructura en la nube donde y cuando la necesite. fácilmente.
Precios
¡Siento que esto actuará como los puntos más convincentes! AWS es una de las plataformas más baratas para el servicio en la nube. Esto es realmente útil para que las pequeñas empresas funcionen y crezcan sin tener que destinar mucho capital de trabajo a los servidores.
Cuadrante mágico de Gartner 2020 para servicios de plataforma e infraestructura en la nube
¿Por qué las empresas hacen hincapié en el conocimiento de AWS para sus científicos de datos?
Independientemente de la empresa para la que trabaje, la infraestructura en la nube se convertirá en una parte importante de su régimen diario de ciencia de datos porque las empresas se han inclinado más hacia la computación en la nube para encontrar soluciones.
Según un informe de Indeed.com, AWS aumentó de una participación del 2,7% en habilidades tecnológicas en 2014 a un 14,2% en 2019. ¡Eso es un cambio del 418%!
Esto se debe al modelo de precios en el que trabaja AWS. AWS funciona con un modelo de pago por uso y cobra por hora o por segundo. También ofrece una opción para reservar una cantidad específica de capacidad informática a tarifas con descuento.
Además, AWS tiene en cuenta a los posibles consumidores que no pueden pagar sus servicios. Para ellos, proporciona el servicio de capa gratuita de AWS, que les permite adquirir experiencia práctica con los servicios de AWS de forma totalmente gratuita.
Todas las empresas, ya sean grandes o pequeñas, quieren ahorrar costes. Las pequeñas empresas ahorran costes en la compra de servidores y los conglomerados ganan autenticidad y productividad. Los servicios de AWS también son muy poderosos. Por un lado, cuando se necesitan días para configurar un clúster de Hadoop con Spark, AWS lo hace en pocos minutos.
Notas finales
En el competitivo mundo actual, tener experiencia práctica con servicios en la nube como AWS brinda una gran ventaja en la carrera de la ciencia de datos. AWS ahora es muy popular entre las empresas y su experiencia con dichas plataformas de computación en la nube resalta sus habilidades durante el proceso de contratación.
Aquí hay algunos recursos adicionales que debería considerar:
Espero que este artículo sirva como un argumento sólido que respalde por qué la computación en la nube es necesaria para los científicos de datos. Utilice la sección de comentarios a continuación si tiene alguna idea para compartir o consultas generales.