El siguiente libro gratuito está dirigido para todas aquellas personas interesadas en aprender sobre la ciencia de datos en la línea de comandos.
La ciencia de datos es un campo interdisciplinario que implica procedimientos científicos, procesos y sistemas para sustraer entendimiento o un mejor conocimiento de datos en sus diferentes maneras, así sea estructurados o no estructurados, lo que es una continuación de ciertos campos de estudio de datos como la estadística, la minería de datos, el aprendizaje automático, y la analítica predictiva.
Sobre el Libro (Por el Autor)
La ciencia de datos es un campo apasionante en el que trabajar. También es muy joven. Desafortunadamente, muchas personas, y especialmente las empresas, creen que se necesitan nuevas tecnologías para abordar los problemas que plantea la ciencia de datos.
Sin embargo, como demuestra este libro, se pueden lograr muchas cosas utilizando la línea de comandos en su lugar y, a veces, de una manera mucho más eficiente.
Hace unos cinco años, durante mi programa de doctorado, pasé gradualmente de usar Microsoft Windows a GNU / Linux. Debido a que al principio daba un poco de miedo, comencé con ambos sistemas operativos instalados uno al lado del otro (conocido como arranque dual).
La necesidad de alternar entre los dos se desvaneció y en algún momento incluso estaba jugando con Arch Linux, lo que le permite crear su propio sistema operativo personalizado desde cero. Todo lo que se le da es la línea de comando, y depende de usted lo que quiera hacer con ella. Por necesidad, rápidamente me sentí cómodo usando la línea de comandos.
Eventualmente, a medida que el tiempo libre se hizo más valioso, me instalé con una distribución GNU / Linux conocida como Ubuntu debido a su fácil uso y su gran comunidad. Sin embargo, la línea de comandos sigue siendo donde hago la mayor parte de mi trabajo.
De hecho, no hace mucho que me di cuenta de que la línea de comandos no es solo para instalar software, configurar el sistema y buscar archivos. Empecé a aprender sobre herramientas de línea de comandos como cortar, ordenar y sed.
Estos son ejemplos de herramientas de línea de comandos que toman datos como entrada, le hacen algo e imprimen el resultado. Ubuntu viene con bastantes de ellos. Una vez que comprendí el potencial de combinar estas pequeñas herramientas, me enganché.
El libro tiene la licencia internacional Creative Commons Attribution-NoDerivatives 4.0.
Contenido (Temas)
- Introducción
- Empezando
- Obtención de datos
- Creación de herramientas de línea de comandos reutilizables
- Limpieza de datos
- Administrar su flujo de trabajo de datos
- Explorando datos
- Tuberías paralelas
- Modelado de datos
- Conclusión
Ficha Técnica
Año: 2014
Editor: O’Reilly
Idioma: Español
Tamaño: 7.78 MB
Licencia: CC-BY-ND
Descarga el Libro
Si te interesaron los temas, te dejamos aquí abajo el enlace de descarga.
Acerca de OpenLibra
OpenLibra busca reunir bajo una misma plataforma el mayor número de publicaciones libres posible. Esto implica una serie de riesgos en cuanto a los contenidos que han de asumirse y sobre los que queremos informar a nuestros usuarios.
En OpenLibra, los libros son responsabilidad exclusiva de sus autores. Esto significa que OpenLibra, no puede garantizar la validez de sus contenidos.
Preguntas Frecuentes
¿Qué quiere decir Biblioteca Libre?
Quiere decir que todos los libros que la componen están licenciados bajo alguno de los muchos tipos de licencia libre que existen y que, por tanto, el autor da su autorización para su reproducción y redistribución.
¿Son entonces todos los libros de esta biblioteca gratis?
Sí; al menos para su versión digital. Muchos autores, además, ofrecen la versión impresa (ya sea directamente o a través del circuito comercial habitual) por la que pueden cobrar lo que estimen oportuno.
Pero algunos de los libros que hay en la Biblioteca tienen Copyright…
El copyright y las licencias libres no son excluyentes. De hecho, las segundas se basan en la legislación sobre la primera para otorgar los derechos de copia y distribución. Es por eso que toda obra bajo una licencia libre, posee un copyright que garantiza la voluntad de su autor. Lo importante es qué permite ese copyright con respecto a la obra licenciada.
Pues he visto algún libro por aquí que tiene un Copyright y un ‘todos los derechos reservados’.
Cierto; en estos casos, lo más habitual es que la editorial haya devuelto los derechos de explotación al autor. Suele ocurrir con los manuales técnicos una vez pasado un tiempo prudencial o, por ejemplo, cuando se han agotado las ediciones impresas y no se pretende una reedición. Una vez los autores vuelven a tener el control, pueden ceder su trabajo al dominio público o permitir su redistribución libre para volver a poner su obra en circulación.
Si los libros son libres y gratis, ¿puedo hacer con ellos lo que quiera? ¿Los puedo imprimir, traducir y/o vender?
No; no puedes hacer aquello que su licencia no permita. Cómo se explica en el enlace de más arriba, algunas licencias solo permiten la descarga y redistribución sin ánimo de lucro. Si por ejemplo, quieres traducir la obra y editarla de forma ordinaria, algunos autores te exigirán que pagues los derechos pertinentes.
Actualmente…
- Curso gratis de contabilidad en Excel en Udemy desbloqueado con cupón del 100% de descuento
- Aprovecha este cupón y aprende Rust gratis en Udemy antes de que termine
- ¿Quieres aprender Algoritmos? La UNAM comparte Libro Gratuito con 64 horas de contenido
- Udemy lanza curso de Python y Angular gratis con cupón limitado acceso inmediato: Crea una aplicación de reconocimiento de objetos
¿Quieres Más?
Encuentra cursos y libros gratuitos, además de cupones de Udemy, en nuestros Telegram.
Fuente de Información: Wikipedia