• Autor de la entrada:
  • Categoría de la entrada:Libros / Noticia
  • Tiempo de lectura:28 minutos de lectura
Anuncios


La ciencia de datos es un campo interdisciplinario que contiene métodos y técnicas de campos como estadísticas, aprendizaje automático, bayesiano, etc.

Todos tienen como objetivo generar conocimientos específicos a partir de los datos. En este artículo, enumeramos algunos libros excelentes sobre ciencia de datos que cubren la amplia variedad de temas relacionados con la ciencia de datos.

En este artículo, enumeramos algunos libros excelentes sobre ciencia de datos que cubren la amplia variedad de temas relacionados con la ciencia de datos.


Te puede interesar también:

1.  El elemento del estilo analítico de datos

libros de ciencia de datos

Este libro ofrece una descripción general de la ciencia de datos. Data Science es un término general muy amplio y este libro es bueno para cualquiera que intente mojarse los pies en el campo por primera vez. Léalo para comprender qué es la ciencia de datos, cuáles son algunas tareas y algoritmos generales, y algunos consejos y trucos generales.

2.  Fundamentos de la ciencia de datos

 
Fundamentos de la ciencia de datos es un tratado sobre campos seleccionados que forman la base de la ciencia de datos como álgebra lineal, LDA, cadenas de Markov, conceptos básicos de aprendizaje automático y estadísticas. Los lectores ideales para el libro son los científicos de datos principiantes que desean mejorar su comprensión matemática y teórica del campo.

3.  Minería de conjuntos de datos masivos

 
Basado en los cursos CS246 y CS35A de Stanford, el libro ayuda a los usuarios a aprender temas para hacer minería de datos en grandes conjuntos de datos. A menudo, un problema muy común que un científico de datos tiene que resolver es realizar tareas numéricas simples (que puede hacer escribiendo pequeños fragmentos de programas) en un conjunto de datos muy grande. MMDS trabaja exactamente para eso. Además de eso, tiene temas como Reducción de dimensionalidad y Sistemas de recomendación que lo ayudan a aprender sobre la aplicación del álgebra lineal y las distancias métricas en el mundo real. Una lectura obligada absoluta para todos los científicos de datos.

4.  Manual de ciencia de datos de Python

libros de ciencia de datos

El manual de ciencia de datos de Python enseña la aplicación de varios conceptos de ciencia de datos en Python. Probablemente el mejor libro para aprender Data Science en Python (el único equivalente es  el mouse book de Wes McKinney ), este libro también se puede leer gratis en Github. Para que puedas aprender sin gastar dinero.

5.  Aprendizaje automático práctico y Big Data

6.  Piensa en las estadísticas

libros de ciencia de datos

Think Stats enseña a los lectores los conceptos básicos de las estadísticas, es decir, los lectores aplicarán conceptos estadísticos y distribuciones en conjuntos de datos del mundo real y tratarán de aprender más sobre los datos utilizando características matemáticas. Probablemente uno de los mejores libros para empezar si quieres aprender estadísticas con Python.

7.  Piensa en Bayes

libros de ciencia de datos

Las estadísticas bayesianas funcionan de forma un tanto diferente a las estadísticas normales. Los conceptos de incertidumbre y distribuciones ajustadas a conjuntos de datos del mundo real hacen que los métodos bayesianos sean más adecuados para aprender sobre conjuntos de datos del mundo real. El estilo extremadamente genial de «aprender programando en Python» del profesor Downey hace que el libro sea un placer para aquellos que comienzan con los métodos bayesianos.

8.  Introducción a los Sistemas Dinámicos Lineales

 
Este libro enseña álgebra lineal aplicada en sistemas del mundo real. Las aplicaciones involucran circuitos, procesamiento de señales, comunicaciones y sistemas de control. El enlace a las notas del curso de años anteriores del profesor Boyd se puede encontrar  aquí .

9.  Optimización Convexa

libros de ciencia de datos

La optimización convexa es lo que muchos algoritmos de aprendizaje automático (y casi todos los algoritmos de aprendizaje profundo) utilizan en segundo plano para llegar al conjunto óptimo de parámetros.

10.  Fundamentos de las metaheurísticas

libros de ciencia de datos

Las metaheurísticas son formas probabilísticas de aprendizaje rápido para realizar tareas que, de otro modo, requerirían que escribiera programas para buscar utilizando la fuerza bruta. Tal vez para datos pequeños, los enfoques de fuerza bruta requieren menos esfuerzo para implementarse, pero se agotan muy rápido con la cantidad de datos agregados. Este libro es probablemente la mejor introducción a los métodos metaheurísticos como los algoritmos genéticos, la escalada, la coevolución y el aprendizaje por refuerzo (básico).

11.  Aprendizaje automático en Python: principales desarrollos y tendencias tecnológicas en ciencia de datos, aprendizaje automático e inteligencia artificial

 
Una buena descripción general de las herramientas de Python en la ciencia de datos. Un muy buen documento para un desarrollador sénior de Python que quiera ingresar a la ciencia de datos o alguien que se esté mudando a Python desde R para ciencia de datos. En general, si desea comprender lo que Python puede hacer por la ciencia de datos, debe leer este artículo.

12.  Ciencia de datos aplicada

libros de ciencia de datos

Applied Data Science de Langmore y Krasner es un libro que adopta un enfoque muy práctico para enseñar Data Science. Desde el uso de Git, la enseñanza de Python básico, el libro pasa a desarrollar los fundamentos de varios algoritmos que se usan con frecuencia en el campo de la ciencia de datos.

13.  Libro de bandidos

 
Con más y más datos acumulados, la toma de decisiones ya no es una función de la intuición sino una función de los datos recopilados. ¿Cuál es el color correcto de un botón de compra en un sitio web de comercio electrónico para pruebas de drogas y decisiones de cartera financiera, los algoritmos bandidos se usan en todas partes? ¡Un muy buen libro para familiarizarse con el “bandolerismo”!

14.  Algoritmos anotados

 
Un libro que te enseña a codificar muchos algoritmos numéricos en Python. Un recurso excelente si desea aprender cómo se implementan los programas matemáticos o si desea aprender Python con enunciados de problemas interesantes.

15.  Inferencia estadística de la era de las computadoras

libros de ciencia de datos

Un libro de Efron y el legendario Hastie que piensa cómo se debe hacer la inferencia estadística (tanto frecuentista como bayesiana) en los tiempos modernos utilizando el poder computacional disponible hoy en día en lugar del enfoque de lápiz y papel que adoptan la mayoría de los otros libros. Esta es una lectura obligada para cualquiera (principiante o experimentado) que tenga la intención de usar Estadísticas en la vida real.

16.  Libro de inferencia causal

 
“Correlación no es causalidad” es una frase que usan mucho los científicos de datos. Pero, ¿cómo separar los dos? Este libro proporciona respuestas describiendo técnicas de inferencia causal para científicos de datos. Necesitará buenos conceptos básicos de probabilidad para leerlo, no para principiantes totales.

17.  Transporte óptimo computacional

 
El transporte óptimo es la matemática de la asignación de un conjunto de distribuciones a otro. Este es probablemente uno de los pocos campos de Data Science que ha ganado más de una Medalla Fields (el más alto honor en Matemáticas). Los conceptos matemáticos se utilizan en muchos algoritmos de Machine Learning y Deep Learning como métricas de distancia y para la resolución de problemas de asignación.

18.  Álgebra, Topología, Cálculo Diferencial y Teoría de Optimización para Ciencias de la Computación y Aprendizaje Automático

 
El libro tiene como objetivo enseñar varios campos matemáticos requeridos en Ciencias de la Computación y Aprendizaje Automático. Bastante matemático y un buen recurso para aquellos que quieren ingresar a la ciencia de datos desde campos pesados ​​​​de matemáticas.

19.  Minería y análisis de datos

La minería de datos, como puede haber visto en el libro MMDS más famoso mencionado anteriormente, es un método para realizar cálculos de manera efectiva en un gran conjunto de datos. Estos cálculos se pueden realizar mediante métodos de fuerza bruta y pueden funcionar bien en conjuntos de datos pequeños, pero pueden tardar mucho en ejecutarse en conjuntos de datos grandes. Un buen libro introductorio y de referencia para la minería de datos.

20.  Pensamiento computacional e inferencial

 
Analiza varios aspectos de la ciencia de datos desde la programación en Python, la causalidad, las tablas, la visualización y las estadísticas básicas. De un curso básico en UC Berkeley, por lo que es un buen recurso para principiantes.

21.  Fundamentos matemáticos de la ciencia de datos

Como sugiere el nombre, el libro brinda y explica el tratado matemático detrás de conceptos de ciencia de datos como la optimización convexa y la reducción de la dimensionalidad. Este libro es recomendable si te gustan las Matemáticas o buscas específicamente aprender Matemáticas detrás de estos conceptos.

22.  Teoría de la información para personas inteligentes

 
La teoría de la información es una de las cuatro teorías matemáticas que encontrará en la ciencia de datos junto con el álgebra lineal, la optimización convexa y la estadística. Este es un buen tutorial para entender la teoría. Lo bueno es que el tutorial es accesible para principiantes.

23.  Introducción al álgebra lineal aplicada: el libro VMLS

Mi libro favorito de Álgebra Lineal de los muchos que mencionaré en esta lista. Es accesible para principiantes y tiene un sentimiento muy aplicado, que no hace que el lector se pierda en muchos conceptos matemáticos.

24.  Álgebra lineal – Hefferon

Mucha gente cree que es el mejor recurso de álgebra lineal para principiantes disponible después de Gilbert Strang. También muy aplicado, (ejercicios de programación en SAGE, que básicamente es Python) pero más para principiantes que para practicantes.

25.  Álgebra lineal: como introducción a las matemáticas abstractas

 
Este libro se siente como mi libro de álgebra lineal de la universidad (que fue amado por muchos estudiantes que estudiaron ingeniería conmigo). Me pierdo un poco cuando hay demasiadas matemáticas y aplicaciones un poco menores, pero muchos disfrutarían la elegancia de tales libros.

26.  Fundamentos de Álgebra Lineal y Optimizaciones

 
Este libro combina álgebra lineal con algoritmos de optimización. Nuevamente, más libros orientados a las matemáticas para personas a las que les gusta el estilo.

Anuncios

27.  Notas de clase de álgebra lineal – Lerner

 
Me pareció muy bueno, es como mostrarte múltiples problemas resueltos para que aprendas. No tanto rigor como los libros anteriores y más aprender mostrando. Buen repaso para las personas que no han tocado Álgebra Lineal durante mucho tiempo.

28.  Apuntes de clase sobre álgebra lineal aleatoria

 
No todos necesitarán leer el libro, ya que trata sobre algoritmos probabilísticos para resolver problemas de álgebra lineal. Útil si trabaja con matrices y vectores grandes, donde los algoritmos simples no funcionarán.

29.  Álgebra lineal a través de productos exteriores

 
Una forma muy diferente de ver el álgebra lineal. Si encuentra interesante el álgebra lineal, debería intentar visualizar los problemas de esta nueva forma.

30.  Álgebra lineal – Cherney et al.

 
Otro libro gratuito para álgebra lineal de nivel universitario. Bueno para principiantes. También viene con problemas de tarea si quieres practicar.

31.  Cálculo matricial que necesita para el aprendizaje profundo

 
Como sugiere el nombre, el tutorial lo ayuda a comprender el cálculo matricial que necesita para el aprendizaje profundo.

32.  Optimización: una introducción

 
La optimización de parámetros es necesaria en problemas en todos los campos de la ingeniería. Si bien la optimización convexa se usa en muchos algoritmos de aprendizaje profundo, al conocer otros algoritmos como la programación lineal, Simplex amplía los horizontes.

33. Notas de clase de Scipy

Si va a trabajar en ciencia de datos, deberá aprender la pila científica de Python. Probablemente el mejor tutorial común para aprender Numpy, Scipy, Scikit-Learn, Scikit-Image y todas las bibliotecas que necesita.

34.  Mega tutorial de los pandas

 
Este gran tutorial es del equipo de desarrollo de Pandas para aprender y comprender la biblioteca. Pandas es una biblioteca que debe aprender si está trabajando en ciencia de datos. No hay escapatoria.

35.  Kalman y filtros bayesianos en Python

 
Los filtros de Kalman y otros filtros bayesianos son útiles cuando se trabaja con datos ruidosos que llegan con el tiempo y que se pueden ajustar a un determinado modelo con parámetros a deducir. La doble función de estos modelos es deducir los parámetros y modelar el ruido. Aunque los ejemplos más utilizados son los datos de ubicación, los filtros similares también pueden funcionar bien en la previsión. (También disponible en  Github )

36.  Inferencia estadística para ciencia de datos

Hemos visto varios libros de inferencia estadística antes de este, pero este está escrito especialmente teniendo en cuenta a los científicos de datos. Si es un científico de datos y está tratando de manejar rápidamente la inferencia estadística, este es su libro.

37.  Matemáticas para el aprendizaje automático

Un libro detallado que le enseña las matemáticas necesarias para dar sentido a la mayoría de los algoritmos de aprendizaje automático que existen. Amigable para principiantes.

38.  Ver la teoría

 
Un libro que facilita el aprendizaje de la probabilidad mediante el uso de visualizaciones interactivas.

39.  Conceptos básicos de estadística

 
Un libro que te introduce al estudio de la estadística. Los principiantes que nunca han aprendido estadística deberían comenzar aquí.

40.  Estadísticas abiertas

 
Combinación de un libro y conferencias en video que introducen a los lectores a la Estadística.

41.  Análisis avanzado de datos desde un punto de vista elemental

 
Una introducción general a los diferentes conceptos de Data Science. Esto incluye modelos causales, modelos de regresión, modelos factoriales, etc. Los programas de ejemplo están en R.

42.  Datos rápidos, inteligentes y a escala

 
Libro que explica la optimización de bases de datos para consultas rápidas. Habla de varios modelos posibles en el mundo real.

43.  Introducción a los bandidos con múltiples brazos

 
Multi-Armed Bandits son algoritmos que toman una decisión a lo largo del tiempo bajo incertidumbre. Este libro es un tratado introductorio sobre los bandidos armados.

44.  Conferencias de economía cuántica

 
Clases sobre economía cuantitativa y código en tus lenguajes de programación favoritos: Python o Julia.

45.  Estadísticas con Julia

 
¿Estadístico aprendiendo Julia o (algo menos probable) Julia programador aprendiendo estadística? Prueba este libro.

46.  Teoría de la información, inferencia y algoritmos de aprendizaje

 
La teoría de la información y la inferencia generalmente se tratan de manera diferente, pero el libro del difunto profesor MacKay trata de abordar ambos temas.

47.  Mejora científica de la toma de decisiones y la gestión de riesgos

 
Un tutorial no demasiado técnico sobre la toma de decisiones probabilística.

48.  Treinta y tres miniaturas: aplicaciones matemáticas y algorítmicas del álgebra lineal

 
Este no es realmente un libro sobre álgebra lineal, sino más bien algunas aplicaciones geniales de álgebra lineal compiladas en un libro.

49.  Tutorial de un algoritmo genético

 
Los algoritmos genéticos son herramientas que todos los científicos de datos necesitan usar en algún momento de su vida. Este tutorial ayuda a los principiantes a comprender cómo funcionan los algoritmos genéticos.

50.  Computación en Investigación Operativa usando Julia

 
Si está trabajando en colas u otros problemas de investigación operativa, Julia puede ser un lenguaje de programación que le guste mucho. Los programas son fáciles de leer como Python y se ejecutan increíblemente rápido.


Deja tus comentarios y sugerencias


Sobre Facialix

Facialix es un sitio web que tiene como objetivo apoyar en el aprendizaje y educación de jóvenes y grandes. Buscando y categorizando recursos educativos gratuitos de internet, de esta manera Facialix ayuda en el constante aprendizaje de todos.


Facialix

Mi objetivo es ayudar en el aprendizaje de los demás, y jugar Halo en mi tiempo libre.

Deja una respuesta

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.