Aller au contenu principal

Kaggle


Kaggle


Kaggle, una subsidiaria de Google LLC, es una comunidad en línea de científicos de datos y profesionales del aprendizaje automático. Kaggle permite a los usuarios encontrar y publicar conjuntos de datos, explorar y crear modelos en un entorno de ciencia de datos basado en la web; trabajar con otros científicos de datos e ingenieros de aprendizaje automático y participar en concursos para resolver desafíos de ciencia de datos.[1]

Historia

Kaggle comenzó en 2010 ofreciendo concursos de aprendizaje automático y ahora también ofrece una plataforma de datos públicos, un banco de trabajo basado en la nube para ciencia de datos y educación en inteligencia artificial. Su personal inicial clave fueron Anthony Goldbloom y Jeremy Howard. Nicholas Gruen fue presidente fundador, sucedido por Max Levchin. El patrimonio en 2011 se elevó llegando a valorar la empresa en $ 25 millones de dólares norteamericanos.

El 8 de marzo de 2017, Fei-Fei Li, científica jefe de Google, anunció que la empresa iba a adquirir Kaggle.[2][3]

En junio de 2017, Kaggle superó el millón de usuarios registrados y, en octubre de 2023, tenía más de 15 millones de usuarios en 194 países.[4][5][6]

En 2022, los fundadores Goldbloom y Hamner dimitieron de sus cargos y D. Sculley se convirtió en director ejecutivo.[7]

En febrero de 2023, Kaggle presentó Models, que permite a los usuarios descubrir y utilizar modelos previamente entrenados a través de integraciones profundas con el resto de la plataforma de Kaggle.[8]

Comunidad de Kaggle

En junio de 2017, Kaggle anunció que superó el millón de usuarios registrados, o Kagglers.[9]​ La comunidad se extiende por 194 países. Es una comunidad diversa, que va desde aquellos que recién comienzan hasta muchos de los investigadores más conocidos del mundo.[10]

Las competiciones de Kaggle atraen regularmente a más de mil equipos e individuos. La comunidad de Kaggle tiene miles de conjuntos de datos públicos y fragmentos de código (llamados «Kaggle kernels» en Kaggle). Muchos de estos investigadores publican artículos en revistas revisadas por pares basándose en su desempeño en las competencias de Kaggle.[11]

En marzo de 2017, el fondo Two Sigma Investments estaba realizando una competencia en Kaggle para codificar un algoritmo de compra y venta de activos.[12]

Servicios de Kaggle

  • Concursos de aprendizaje automático: este fue el primer producto de Kaggle. Las empresas publican problemas y los participantes compiten para construir el mejor algoritmo, generalmente con premios en efectivo.
  • Kaggle Kernels: un banco de trabajo basado en la nube para ciencia de datos y aprendizaje automático. Permite a los científicos de datos compartir código y análisis en Python, R y R Markdown. Más de 150K «kernels» (fragmentos de código) se han compartido en Kaggle que cubren desde el análisis de sentimientos hasta detección de objetos.
  • Plataforma de conjuntos de datos públicos: los miembros de la comunidad comparten conjuntos de datos entre sí. Tiene conjuntos de datos de desde radiografías de huesos hasta resultados de peleas de boxeo.
  • Kaggle Learn: una plataforma para la educación de la IA en fragmentos más manejables.

Cómo funcionan las competiciones de Kaggle

  1. El anfitrión de la competencia prepara los datos y una descripción del problema.
  2. Los participantes experimentan con diferentes técnicas y compiten entre sí para producir los mejores modelos. El trabajo se comparte públicamente a través de Kaggle Kernels para lograr un mejor punto de referencia e inspirar nuevas ideas. Los envíos se pueden realizar a través de Kaggle Kernels, mediante la carga manual o utilizando la API de Kaggle. Para la mayoría de las competiciones, las presentaciones se califican de inmediato (según su precisión predictiva en relación con un archivo de solución oculto) y se resumen en una tabla de clasificación en vivo.
  3. Una vez transcurrido el plazo, el anfitrión del concurso paga el premio en metálico a cambio de «una licencia mundial, perpetua, irrevocable y libre de regalías [...] para utilizar la Participación ganadora», es decir, el algoritmo, el software y la propiedad intelectual relacionada desarrollados. que es «no exclusivo a menos que se especifique lo contrario».[13]

Además de sus competencias públicas, Kaggle también ofrece competencias privadas limitadas a los principales participantes de Kaggle. Kaggle ofrece una herramienta gratuita para que los profesores de ciencia de datos realicen concursos académicos de aprendizaje automático, Kaggle In Class.[14]​ Kaggle también organiza concursos de reclutamiento en los que los científicos de datos compiten por la oportunidad de entrevistarse en empresas líderes en ciencia de datos como Facebook, Winton Capital y Walmart.

Impacto de las competiciones de Kaggle

Kaggle ha realizado cientos de concursos de aprendizaje automático desde que se fundó la empresa. Las competiciones van desde mejorar el reconocimiento de gestos para Microsoft Kinect[15]​ hasta hacer una IA de fútbol para el Manchester City o mejorar la búsqueda del bosón de Higgs en el CERN.[16]

Las competiciones han dado lugar a muchos proyectos exitosos que incluyen la mejora del estado del arte en la investigación del VIH,[17]​ calificaciones de ajedrez[18]​ y pronósticos de tráfico.[19]​ Los más famosos, Geoffrey Hinton y George Dahl, usaron redes neuronales profundas para ganar una competencia organizada por Merck. Y Vlad Mnih (uno de los estudiantes de Hinton) usó redes neuronales profundas para ganar una competencia organizada por Adzuna. Esto ayudó a mostrar el poder de las redes neuronales profundas y resultó en que la técnica fuera adoptada por otros en la comunidad de Kaggle. Tianqi Chen de la Universidad de Washington también usó Kaggle para mostrar el poder de XGBoost, que desde entonces ha reemplazado a Random Forest como uno de los principales métodos utilizados para ganar competencias de Kaggle.

Se han publicado varios artículos académicos sobre la base de los hallazgos realizados en los concursos de Kaggle.[20]​ Una clave para esto es el efecto de la tabla de clasificación en vivo, que anima a los participantes a seguir innovando más allá de las mejores prácticas existentes.[21]​ Los métodos ganadores se escriben con frecuencia en el blog de Kaggle.

Finanzas

En marzo de 2017, Fei-Fei Li, directora científica de Google, anunció que Google iba a adquirir Kaggle durante su discurso de apertura en Google Next.[22]

Referencias

Otras lecturas

  • "La competencia arroja luz sobre la materia oscura", Office of Science and Technology Policy, sitio web de Whitehouse, junio de 2011
  • "Que gane el mejor algoritmo. . . " , The Wall Street Journal, marzo de 2011
  • "El concurso de Kaggle tiene como objetivo impulsar a los editores de Wikipedia", New Scientist, julio de 2011
  • "Verificación de la investigación en biología de sistemas en la era de la competencia colaborativa", Nature Nanotechnology, septiembre de 2011

Enlaces externos

  • Sitio web oficial
  • Blog de Kaggle Winner, el blog de Kaggle

Text submitted to CC-BY-SA license. Source: Kaggle by Wikipedia (Historical)