Lagos de datos: La base del análisis de big data


Por Kristina Scott

Los lagos de datos son arquitecturas flexibles y escalables que están cambiando la forma en que las empresas almacenan y procesan los datos.

Las empresas generan y utilizan más datos que nunca. Estos datos proceden de diversas fuentes, como las interacciones con los clientes, las redes sociales y los dispositivos IoT, entre otros. Y a menudo se almacenan en diferentes formatos, lo que dificulta su uso, su análisis y la obtención de información. Ahí es donde entran en juego los lagos de datos.

Los lagos de datos son nuevos en el mundo de la analítica de big data, y se están convirtiendo rápidamente en la opción adecuada para las organizaciones. Según un informe de MarketsandMarkets, se espera que el mercado de los lagos de datos crezca de 7.900 millones de dólares en 2019 a 20.100 millones de dólares en 2024, a una tasa de crecimiento anual compuesta del 20,6%.

Profundicemos en la finalidad de los lagos de datos, exploremos tus ventajas y miremos hacia su futuro.

¿Qué es un lago de datos?

Los lagos de datos fueron introducidos a principios de la década de 2000 por Apache Hadoop como alternativa a las limitaciones del almacenamiento de datos. Un lago de datos es un sistema que permite almacenar grandes cantidades de datos no estructurados, semiestructurados y estructurados a bajo costo.

En pocas palabras, un lago de datos es un gran repositorio que almacena datos sin procesar en su formato original. En comparación con un almacén de datos, que almacena los datos en archivos o carpetas jerárquicos, un lago de datos utiliza una arquitectura plana y almacenamiento de objetos.‍ Los almacenes de datos tradicionales brindan análisis a las empresas, son caros, rígidos y muchas veces  no están equipados para los casos que las empresas tienen hoy en día, por lo que la demanda de lagos de datos está aumentando.

Los lagos de datos consolidan los datos en una ubicación central donde pueden almacenarse tal cual, sin necesidad de implantar ninguna estructura formal para la organización de los datos. Así, se elimina la necesidad de preprocesar o transformar los datos antes de almacenarlos, lo que los convierte en una solución de almacenamiento ideal para una gran cantidad de datos. Luego, estos datos en bruto pueden procesarse y analizarse mediante una serie de herramientas y tecnologías, como algoritmos de Machine Learning, visualización de datos y análisis estadístico. Los lagos de datos se construyen sobre Hadoop Distributed File System (HDFS ) o almacenamiento en la nube, como Amazon S3, Microsoft Azure o Google Cloud Storage.

¿Por qué son importantes los lagos de datos?

A menudo, una empresa ha tenido big data y simplemente no lo sabía. Por ejemplo, los datos no se utilizan porque los requisitos empresariales actuales sólo utilizan un subconjunto de los datos que intercambia un cliente o socio. Los lagos de datos permiten a una empresa consumir e ingerir grandes cantidades de datos en bruto, lo que permite el descubrimiento de datos de una manera barata, eficiente y medible. Las empresas impulsadas por los datos tienden a centrarse en las necesidades empresariales futuras, que requieren nuevas perspectivas de los datos existentes y el uso de tecnologías más recientes, como el Machine Learning para el análisis predictivo.

Además, los lagos de datos permiten a las organizaciones democratizar el acceso a los macrodatos, haciendo realidad las decisiones basadas en datos. La ventaja más significativa de los lagos de datos es que permiten a las organizaciones analizar los datos con mayor eficacia y obtener información más rápidamente para potenciar la toma de decisiones.  

Los lagos de datos permiten a las empresas centrarse más en los datos, ya que pueden acceder y analizar grandes volúmenes de datos de forma rápida y eficiente, cambiando la cultura para adoptar el pensamiento basado en los datos en toda la organización. Y merece la pena: un estudio de Deloitte descubrió que las empresas con la cultura más sólida en torno a los conocimientos y la toma de decisiones basados en datos tenían el doble de probabilidades de superar significativamente los objetivos empresariales. Los lagos de datos permiten que esa cultura de big data prospere y sea accesible a todos los niveles de la organización. La investigación de BCC también descubrió que las empresas que utilizan servicios de lago de datos superan a empresas similares en un 9% en crecimiento orgánico de ingresos.

¿Cómo utilizan las empresas los lagos de datos?

"Lo único que sería imporante que más personas supieran es que los lagos de datos constituyen una herramienta que tiene un gran potencial, pero que puede utilizarse mal. Es vital tener una estrategia para mantener los datos organizados y evitar convertir el lago en un pantano."

Michael Rounds, Director de Ingeniería y Análisis de Datos, Kopius

Empresas de diversos sectores utilizan los lagos de datos para obtener información, mejorar las operaciones y tener una ventaja competitiva. En una encuesta realizada por TDWI, el 64% de las organizaciones afirmaron que el principal objetivo y beneficio de un lago de datos unificado es poder obtener mayor valor del análisis del negocio y las operaciones en base  los datos. Otros de los principales valores añadidos son la reducción de los silos, la obtención de una mejor base para la analítica en comparación con los tipos de datos tradicionales, y las ventajas de almacenamiento y ahorro de costos.

Estos son algunos ejemplos prácticos de casos de organizaciones que implantan lagos de datos en operaciones empresariales:

  • Los minoristas utilizan los lagos de datos para analizar el comportamiento de los clientes y su historial de compras con el fin de ofrecerles recomendaciones y promociones personalizadas.
  • Las organizaciones sanitarias aprovechan los lagos de datos para almacenar datos de pacientes procedentes de múltiples fuentes, como historia clínica electrónica y wearables, con el fin de diagnosticar y tratar mejor las enfermedades.
  • Los fabricantes usan lagos de datos para supervisar y optimizar los procesos de producción y analizar el rendimiento de los productos, reduciendo así los costos operativos.
  • Las instituciones financieras utilizan los lagos de datos para conocer mejor el comportamiento de los clientes, analizar y detectar actividades fraudulentas, mejorar la gestión de riesgos y mejorar la experiencia del cliente.

En general, los lagos de datos ayudan a las empresas a tomar decisiones más informadas. Al almacenar todos los datos en una ubicación central, las empresas pueden encontrar patrones y tendencias que antes estaban ocultos. Pueden democratizar el acceso a los datos y ser más agilees y competitivas.

¿Cuál es el futuro de los lagos de datos?

El futuro de los lagos de datos es brillante, ya que las empresas siguen invirtiendo en análisis de big data para mantenerse por delante de la competencia. Con el creciente dominio de tecnologías como la inteligencia artificial (IA) y el Machine Learning (ML), los lagos de datos pueden volverse más inteligentes y potentes, capaces de crear modelos predictivos y automatizar los procesos de toma de decisiones.

McKinsey sugiere que las empresas aprovechen al máximo la tecnología de los lagos de datos y su capacidad para gestionar funciones informáticas intensivas, como el análisis avanzado o Machine Learning. Es posible que las organizaciones deseen crear aplicaciones centradas en datos, sobre el lago de datos, que puedan combinar perfectamente los conocimientos obtenidos con los recursos del lago de datos y otras aplicaciones. Los lagos de datos pueden utilizarse para desarrollar nuevos modelos de negocio y fuentes de ingresos, ya que las empresas buscan formas de rentabilizar tus activos de datos.

¿Está listo para aprovechar el poder de los lagos de datos en su empresa? Kopius puede ayudarle a construir el futuro de su organización impulsada por datos mediante la racionalización de su arquitectura de datos y la entrega de potentes análisis a través de la gobernanza de datos, el aprendizaje automático, la visualización de datos y mucho más. Conozca nuestras soluciones de Data Lakes.

Recursos adicionales


Cómo evitar el cambio de contexto y ser un ingeniero de software más feliz


Formar parte de Kopius ofrece oportunidades de crecimiento profesional y académico.

Nuestra Academia Kopius ofreció hace poco una sesión sobre el cambio de contexto para ingenieros de software y desarrolladores, dirigida por nuestro Director de Ingeniería de Software, Yuri Brigance. Este post resume los mensajes clave de Yuri sobre el cambio de contexto y cómo reducir las distracciones cuando los ingenieros necesitan concentrarse.

La ingeniería es un trabajo creativo: requiere formación, habilidades, talento y experiencia. Además, las actividades de ingeniería tienen larga duración y requieren investigación y preparación antes de ejecutar una tarea.

cambio de contexto

"Una de las cosas que he estado intentando mejorar es cómo permitirme hacer trabajo de concentración -trabajo en profundidad como escribir código o arquitectura- mientras gestiono otras responsabilidades como la preventa, tener reuniones individuales, etc.", dijo Brigance.

El cambio de contexto en ingeniería es el proceso de pasar de un programa a otro, ya que las personas sólo pueden centrarse en una tarea a la vez (hacer varias cosas a la vez no es más que un cambio rápido de contexto).

Hay dos tipos de tareas: sencillas y exigentes, y cada tarea tiene dos partes:

  1. Carga la tarea. Si fueras una computadora, eso significaría abrir y cargar un programa. Pero tú eres humano, así que se trata de recordar el contexto, como por ejemplo dónde lo dejaste, notas, etc.
  2. Guarda el progreso. Cuando estés listo para dejar de trabajar, debes guardar tu contexto. La mejor forma de terminar una tarea es completarla, pero si debes pausarla, existe ese periodo de "guardar" en el que tienes que dejar a un lado lo que estabas haciendo.

La duración del cambio entre tareas complejas varía en función de la complejidad de la tarea.

No tienes control sobre el tiempo que tarda en guardarse o cargarse tu contexto, así que si te interrumpen, tardará más en cargarse. "Que te interrumpan es como que se cuelgue tu programa: tardarás más en volver a tu flujo de trabajo. Si te interrumpen, emplearás más tiempo en volver a trabajar la próxima vez que inicies esa tarea", afirma Brigance.

La productividad tiende a aumentar con el tiempo. Una vez construido el contexto mental, cuanto más tiempo trabajamos sin interrupciones, más productivos somos. Por eso es útil concentrar las reuniones en la primera mitad del día para que, una vez terminadas, los ingenieros puedan centrarse en el código con menos interrupciones o distracciones.

Esto tiene la ventaja extra de terminar el día habiendo hecho progresos significativos y concentrados, lo que puede ayudar a los ingenieros a sentirse más felices y menos estresados.

Hay dos tipos de interrupciones:

  • Interrupción simple: Una interrupción simple no requiere que te prepares para ella, como una notificación en Slack. Experimentas la interrupción y luego reconstruyes tu contexto mental, pero no necesitas guardar tu trabajo antes de esta interrupción. Puedes reducir las interrupciones simples gestionando tu estado en Slack/Teams, desactivando las notificaciones, silenciando tu teléfono, etc. Es útil agrupar las tareas sencillas y hacerlas todas en un único espacio de tiempo. También puedes reducir las interrupciones simples que sufren los demás siendo consciente del trabajo de la gente y evitando interrumpirles si están ocupados.
  • Interrupciones complejas: Las interrupciones complejas son tareas que requieren preparación, como las reuniones. Puedes reducir el impacto de las interrupciones complejas programando reuniones demasiado seguidas para que los descansos de 30-60 minutos entre reunión y reunión no se traduzcan en tiempo desconcentrado.

Aquí tienes otros consejos que te ayudarán a evitar la fatiga del cambio de contexto y a disfrutar más y mejor del trabajo en profundidad:

  • Si tienes varias reuniones, agrúpalas y prográmalas lo más temprano posible para que la gente pueda concentrarse el mayor tiempo posible por la tarde.
  • Ofrezca un día sin reuniones para que haya un día a la semana en el que se puedan realizar grandes y complejas tareas con las mínimas interrupciones.  
  • Si en tu trabajo hay mucha interacción con el cliente y mucha investigación, puede ser útil dividir la semana por tipos de contextos.
  • Elimine las reuniones innecesarias.
  • Evite las pausas de 30-90 minutos entre reuniones.
  • Reserva pequeñas tareas para los descansos durante las reuniones.
  • Rechaza las reuniones de baja prioridad. Todas las reuniones son importantes para alguien, pero si tienes poco tiempo, puede que tengas que saltártelas.
  • Comunícate con los demás cuando necesites tiempo de concentración.
  • Desactiva las notificaciones push que no sean importantes.
  • Dedica tiempo a las pausas entre tareas para reflexionar y planificar.

El trabajo de ingeniería y desarrollo requiere creatividad y energía concentrada. Comprender el impacto del cambio de contexto y encontrar formas de reducirlo puede dar lugar a ingenieros más felices, sanos y productivos, y a mejores soluciones de software.

¿Qué es la Academia Kopius?

Nuestra empresa ofrece un programa educativo llamado Kopius Academy, en el que impartimos sesiones educativas relevantes para nuestras careers en transformación digital. Ya sean dirigidas por miembros de nuestro propio equipo o por expertos externos, cada mes aportamos a nuestros equipos contenidos educativos que van desde lo altamente técnico hasta sesiones sobre conciliación de la vida laboral y personal y bienestar.

¿Quiere saber más sobre Kopius y nuestra Academia Kopius? Organizamos regularmente eventos educativos, seminarios web y hackathons para el público, que se pueden encontrar en nuestra página de empleo en LinkedIn, Instagram y Twitter.

Recursos adicionales


Valence Group y la división latinoamericana de MajorKey se combinan para crear Kopius, una potencia tecnológica nearshore


Rebrand to Kopius lanza un nuevo socio de transformación digital nearshore de servicio completo para clientes comerciales y del sector público

Seattle, 20 de marzo de 2023 - Hoy marca el lanzamiento de Kopius, un negocio de soluciones digitales nearshore co-localizado en Seattle y Buenos Aires. Kopius se ha formado a través de la combinación de Valence, una consultora digital con sede en Seattle, y la división latinoamericana de MajorKey, una empresa de servicios tecnológicos con sede en Chicago. Ambas empresas forman parte de The Acacia Group, inversores especializados en empresas de transformación digital. Acacia está respaldando la formación de Kopius para dar servicio a la creciente demanda de los clientes de los excepcionales equipos de consultoría y entrega digital nearshore que ofrece el negocio combinado. El negocio estadounidense de MajorKey seguirá centrado en el mercado de la gestión de identidades y accesos. 

El lanzamiento de Kopius transforma el valor de la empresa combinada para tus clientes comerciales y del sector público. Reúne a un equipo altamente cualificado procedente de EE.UU. y Latinoamérica, capaz de trabajar a gran escala y con rapidez para abordar desafíos complejos en toda la gama de tecnologías digitales fundamentales para la transformación eficaz de las empresas. En la actualidad, Kopius presta apoyo a casi 100 clientes comerciales y del sector público de EE.UU. con más de 600 consultores, diseñadores e ingenieros. Kopius ofrece capacidades integrales en experiencia y estrategia digital, soluciones tecnológicas y servicios operativos y de ingeniería. 

"Es un día emocionante para todos en Kopius. Corona la integración de dos grandes empresas para crear una nueva potencia digital. Todo el equipo está unido en torno a la misión de resolver los desafíos tecnológicos digitales de forma creativa", dijo Jim Darrin, CEO de Kopius. "Nuestro verdadero valor para los clientes reside en nuestra capacidad para lograr claridad estratégica, crear soluciones prácticas para el presente y planificar continuamente el futuro. De esa manera, ayudamos a los clientes a obtener más valor de tus inversiones en tecnología y navegar por el futuro con confianza." 

"Un elemento central de nuestra estrategia para Kopius es mantener un hogar estimulante y gratificante para los mejores talentos técnicos de la empresa en los Estados Unidos y América Latina", dijo Matías Mazzuchelli, Director de Operaciones de Kopius. "Nuestro trabajo ayudando a algunas de las marcas más grandes del mundo a mantener su ventaja crea una gama emocionante y diversa de oportunidades para consultores, diseñadores, ingenieros y desarrolladores para trabajar en la vanguardia de la tecnología y la innovación. Estamos encantados de dar la bienvenida a nuevas personas a la familia Kopius a medida que crecemos."

"El lanzamiento de Kopius ejemplifica nuestro enfoque para construir negocios más fuertes que logren un mayor impacto para tus clientes y creen nuevas oportunidades para su gente", dijo Tim Matthews, socio de Acacia. "La demanda de los clientes está creciendo para el tipo de servicios digitales agilees, escalables y de alto valor que ofrece Kopius. Con un equipo tan excepcional, sabemos que tendrán un gran impacto en su mercado."

La dirección de Kopius combina una experiencia líder en el sector en estrategia tecnológica, diseño de soluciones, ingeniería, contratación técnica y creación de equipos. Juntos, se centrarán sin descanso en el diseño de soluciones de calidad proporcionadas por equipos formados por los mejores talentos locales y regionales, técnicamente cualificados para los problemas que resuelven y culturalmente compatibles con los clientes a los que sirven.

Acerca de Kopius

Kopius es una empresa de soluciones digitales nearshore. Somos líderes prácticos e ingeniosos de la transformación digital. Kopius opera en todas las etapas de la transformación digital con servicios integrados de consultoría, diseño e ingeniería prestados por equipos de consultoría y entrega nearshore. Aplicando la creatividad, la curiosidad y el ingenio a todo lo que hacemos, guiamos a los clientes en su viaje tecnológico, ayudándoles a adaptarse al cambio y a explotar los nuevos avances digitales, obteniendo un valor continuo de tus inversiones en tecnología. Para obtener más información, visite www.kopiustech.com.

Acerca del Grupo Acacia

Acacia Group es una empresa de inversión especializada en crear empresas más fuertes aprovechando el poder de la transformación digital. Trabajamos estrechamente con los equipos directivos como socios comprometidos y solidarios, fomentando culturas resistentes de colaboración e innovación para hacer que las empresas sean más valiosas para tus clientes, empleados y coinversores. Potenciando a líderes hábiles, cultivando talentos excepcionales, invirtiendo en innovación y creando marcas distintivas, creamos las cualidades que las empresas necesitan para lograr un éxito duradero. Para más información, visite The Acacia Group o síganos en LinkedIn.


Mujeres en la tecnología: Conozca a Bridgette Arthur-Mensah


Mujeres en la tecnología

Nos sentamos con Bridgette Arthur-Mensah, líder en operaciones tecnológicas y de ingeniería.

Tras estudiar ingeniería eléctrica en Rutgers y la Universidad de Columbia, Bridgette comenzó su career profesional en el sector del hardware y luego pasó al del software gracias a una oportunidad inesperada. En la actualidad, ofrece servicios de asesoramiento para ayudar a los clientes a mejorar la experiencia de los usuarios y el crecimiento mediante la agilidad empresarial, la innovación tecnológica y la gestión de costos en diversos sectores.

Arthur-Mensah también es vicepresidenta de la sección neoyorquina de la Healthcare Businesswomen's Association y trabaja como voluntaria en el Center for Information & Study on Clinical Research Participation.

Hablamos con Bridgette sobre las tendencias en tecnología y cómo encajan las mujeres en esta industria. ¡Aquí tienes lo más destacado de ese intercambio!

Describe el tipo de trabajo que estás haciendo hoy.

Hoy considero que mi trabajo consiste en ser un líder estratégico y un solucionador de problemas práctico, y me centro en dos cosas: la ejecución y la economía de la tecnología.

Para la ejecución, ayudo a las organizaciones a optimizar y gestionar su inversión en tecnología. Busco la forma más óptima de elaborar estrategias, planificar y ofrecer servicios o productos a clientes y usuarios. Me aseguro de que tengamos visión de futuro en la ejecución y de que seamos agilees.

En economía, estos días me centro en el control de costos. Ayudo a las organizaciones a maximizar las economías de escala, a reflexionar sobre la estructura de los contratos y a maximizar el poder adquisitivo. La economía actual hace que sea importante saber cómo utilizar lo que se tiene y hacer que el dinero rinda más. Por ejemplo, podríamos examinar si una empresa está cobrando deudas tecnológicas sin entender primero qué prestaciones se utilizan realmente. Gestionar esa deuda tecnológica lleva tiempo y dinero, y yo ayudo a las empresas a analizar esas decisiones.  

¿Cómo empezó en el mundo de la tecnología?

Crecí en Ghana, África Occidental, y en la escuela secundaria elegí STEM como mi área de interés por el proceso de eliminación. No me gustaban la literatura ni las artes liberales, ni tampoco la biología (¡aunque a mi padre le habría encantado que fuera médico!), así que me centré en la física, la ingeniería y las matemáticas. Me gustaban los desafíos. Me gusta la idea de que puedes construir algo y cobra vida.

Ese inicio me puso en el camino que me llevó a Estados Unidos, donde obtuve mis títulos de ingeniería eléctrica. 

Empecé con el hardware, trabajando en ingeniería en IBM. Es increíble la potencia de cálculo que se puede obtener de pequeños átomos, y cómo los átomos impulsan todo lo que ocurre en la capa de software.

Después de pasar 12 años trabajando con semiconductores, se pusieron en contacto conmigo para ofrecerme un trabajo que me llevaría del hardware al software, y lo acepté. El resto es historia.

¿Cómo influyeron sus mentores y el liderazgo en su éxito?

Un buen mentor puede ayudarte a evitar ciertos escollos y a hacer algo mejor con algunos consejos. Ojalá me hubiera puesto en contacto con mentores antes en mi career , porque la tutoría es estupenda. Si tuviera que volver a hacerlo -y es el consejo que doy a mis hijos-, encontraría buenos mentores y los mantendría. Tanto si te los asignan como si tú mismo construyes las relaciones, los mentores son personas a las que puedes pedir ayuda cuando te encuentras en situaciones difíciles.

La tutoría me ha ayudado a ser intencionada en mi career, así que me gusta retribuir a mis compañeros y a los que están surgiendo en esta industria.

¿Cómo podemos mejorar la tecnología para las mujeres?

Es una gran pregunta y necesitamos más de una solución para mejorar la tecnología para las mujeres. Por ejemplo, uno de mis modelos, Indra Nooyi. En su libro Mi vida plenademostró que mantener a las mujeres en los negocios es una buena decisión económica. Del mismo modo, mantener a las mujeres en la tecnología es bueno para la economía y el sector.

¿Cómo mantener a las mujeres en la tecnología? He aquí dos necesidades urgentes:

En primer lugar, las mujeres suelen ser responsables del cuidado de otras personas, ya sean padres, hijos o ambos. Por eso, las empresas deben ayudar a las mujeres a conciliar la vida familiar con la laboral. Muchas empresas se están moviendo en la dirección correcta, ampliando aspectos como el permiso maternal y paternal de seis semanas a seis meses. Covid también desestigmatizó el trabajo desde casa, lo que ayudó en cierto modo. Por eso, hay que crear un medio que las mujeres puedan incorporar y sentirse parte. ¿Se pueden celebrar actos sociales en la empresa durante la jornada laboral en lugar de fuera del horario de trabajo? ¿Puede avisar con más antelación antes de una salida de varios días? Si dificultas la participación de las mujeres, pierdes el beneficio de tus perspectivas y experiencia.

La segunda necesidad urgente es que los líderes tengan la intención de incluir a las mujeres en las iniciativas estratégicas. Crear oportunidades para que las mujeres muestren su talento y avancen en tus carreras. Esto puede significar que las personas en puestos de liderazgo deban abordar sus propios prejuicios inconscientes. Cuando nuestra industria está llena de prejuicios inconscientes, es difícil que las mujeres consigan igualdad de oportunidades. Los líderes tienen que trabajar sus prejuicios inconscientes y comprometerse a hacer crecer a las mujeres líderes colocándolas en puestos que les permitan esforzarse y demostrar lo que pueden aportar.  

Recuerde que esto, a fin de cuentas, es tan bueno para el resultado final como para las mujeres, porque mantener a las mujeres en la tecnología es bueno para la tecnología.

¿Qué le gustaría que supiera más gente sobre el apoyo a las mujeres en la tecnología?

Me gustaría que más gente abriera los ojos a una nueva idea de cómo puede ser, sonar y actuar un líder. Hay diferencias entre el liderazgo femenino y el masculino, y muchas mujeres no encajan en las anticuadas nociones de lo que es un líder de éxito. Dejar de lado esas ideas preconcebidas puede abrir puertas.

Además, hay que empezar pronto. Me encanta que cada vez más organizaciones estén promocionando STEM entre las niñas. Tenemos que mostrar a las niñas que STEM es divertido e impactante y que si trabajan en STEM, pueden construir productos que cambien para bien la forma en que vivimos. Queremos que las niñas utilicen su extraordinario talento en STEM para dar forma a este mundo ahora y en el futuro.

¿Qué consejo le gustaría dar al lector?

En primer lugar, la tecnología se está convirtiendo en un lenguaje básico y es necesario que seamos lo conozcamos para verificar que nos está sirviendo bien. Incluso los trabajos que no se consideran técnicos requieren ahora un nivel de alfabetización tecnológica, desde el diseño a los servicios jurídicos o la medicina. Cuando te abres a conocer lo nuevo y a entenderlo, te abres a más oportunidades y maneras de aplicarla.

En segundo lugar, si eres una mujer en el sector tecnológico, puede parecer que el futuro es sombrío en estos momentos debido al reciente entorno económico. Pero recuerde que se trata de un sector cíclico. No dejes que la recesión de ahora merme tu deseo de hacer más, o de crecer más, o de encontrar nuevas cosas que hacer en tecnología. Tu camino en career puede tener un comienzo más lento de lo que habías previsto, pero tus ideas y capacidades son necesarias en la tecnología y los negocios.

Mi consejo es que sigas nadando. Red. No abandone la vida laboral. Sigue aportando. Sigue.

¿Qué tendencias observas en la tecnología?

En primer lugar, la IA está cambiando la productividad, y está llegando a ser algo precisa. La próxima tendencia será que la IA se entrene para mejorar su rendimiento para usos y públicos de los márgenes. Por ejemplo, la IA de reconocimiento de voz se había entrenado en comprender la tonalidad de los grupos demográficos dominantes, y debemos ampliar el entrenamiento de estos modelos de IA para abarcar las  minorias. Ampliar los conjuntos de datos utilizados en el entrenamiento podría ayudar a mejorar la precisión.

Y hablando de IA, también debemos reflexionar sobre cómo aplicar la estrategia a las implantaciones de IA. Es una buena herramienta y la gente está entusiasmada. Las empresas tienen que pensar en cómo ayuda a diferenciar su propuesta de valor con precisión, por supuesto.  

En segundo lugar, las empresas están analizando el costo y la economía de la tecnología. En los últimos años, ha habido un apetito insaciable por la tecnología y los dispositivos, especialmente en el espacio de la tecnología sanitaria. Los inversores se están cuestionando el valor económico de estas tecnologías y lo que cuesta mantenerlas en el mercado.

En tercer lugar, la globalización está cambiando la ciberseguridad. La gente quiere una experiencia interconectada sin fisuras al pasar de una tecnología a otra, por lo que estamos compartiendo datos y éstos se utilizan de maneras cada vez más amplias. Las empresas deben preocuparse por la ciberseguridad si quieren operar en países con normas de seguridad estrictas (entre ellos, la mayor parte de Europa y Estados Unidos). Y si su marca va a depender de la confianza de los clientes, basta una sola brecha importante para que los clientes se vayan al siguiente proveedor. Y una brecha también podría suponer la pérdida de futuras oportunidades y consideraciones de proveedor. Por estas razones, las empresas vigilan la seguridad más que nunca.

¿Qué tecnología necesita el mundo ahora más que nunca?

El número de catástrofes naturales relacionadas con el cambio climático y su magnitud son alarmantes. Mi mayor esperanza es que la tecnología pueda ayudar a resolver nuestro problema medioambiental global. Es la cuestión más importante de nuestro tiempo.

Para obtener más información sobre nuestras capacidades de transformación digital, póngase en contacto con nosotros hoy mismo. Kopius es líder en consultoría y servicios de tecnología digital nearshore.


Recursos adicionales:


5 industrias ganadoras en inteligencia artificial


Por Lindsay Cox

La inteligencia aumentada (IA) y el Machine Learning (ML) ya eran las tecnologías en el radar de todo el mundo cuando empezó el año, y el lanzamiento de Modelos Fundacionales como ChatGPT no hizo más que aumentar el entusiasmo sobre las formas en que la tecnología de datos puede cambiar nuestras vidas y nuestros negocios. Estamos entusiasmados con estas cinco industrias que están ganando en inteligencia artificial.

Como organización, los proyectos de datos e inteligencia artificial son nuestro punto fuerte. ChatGPT está muy de actualidad en estos momentos (y es una herramienta superguay; puedes echarle un vistazo aquí si aún no lo has hecho).

También disfruté viendo a Watson jugar a Jeopardy como antiguo IBMer 😊.

Hay algunos ejemplos reales de cómo cinco organizaciones están triunfando con la IA. Hemos incluido esos casos de uso junto con ejemplos en los que nuestros clientes han liderado proyectos relacionados con la IA.

Puede encontrar más casos prácticos sobre transformación digital, datos y desarrollo de aplicaciones de software en nuestra sección de casos prácticos del sitio web.

Marcas de consumo: Visualizar es fácil

Las marcas están ayudando a los clientes a visualizar el resultado de tus productos o servicios utilizando la visión por computadora y la IA. Por ejemplo, los consumidores pueden probarse virtualmente un nuevo par de gafas, un nuevo corte de pelo o un traje nuevo. La IA también puede utilizarse para visualizar un cuarto de baño o un jardín remodelados.

Ayudamos a una marca de odontología a distancia que da prioridad a la web a desarrollar una solución de visión por computadora para mostrar a un cliente cómo quedaría su sonrisa tras un posible tratamiento. Emparejamos la solución de visión por computadora con una aplicación web móvil para que los clientes pudieran "ver su nuevo selfie". 

Las preguntas de los consumidores pueden resolverse con mayor rapidez y precisión

El servicio de atención al cliente puede determinar la fidelidad del cliente, por lo que los chatbots y los asistentes virtuales se están implementando a gran escala para reducir el tiempo medio de gestión, la velocidad media de respuesta y aumentar las resoluciones en la primera llamada.

Trabajamos con un sistema sanitario regional para diseñar y desarrollar una "puerta de entrada digital" que mejore la experiencia de pacientes y proveedores. La solución incluye una búsqueda web interactiva y funciones de chatbot. Al ofrecer respuestas más rápidas a pacientes y proveedores, el sistema sanitario puede aumentar la satisfacción y mejorar la atención y los resultados de los pacientes.

Finanzas: Prevención del fraude

Existe una gran oportunidad para que las organizaciones de servicios financieros utilicen soluciones de IA y aprendizaje profundo para reconocer transacciones dudosas y frustrar el fraude con tarjetas de crédito, lo que ayuda a reducir costos. También conocida como detección de anomalías, los bancos generan enormes volúmenes de datos que pueden utilizarse para entrenar modelos de Machine Learning con el fin de detectar transacciones fraudulentas.

Agricultura: Apoyo a los objetivos ESG mediante una explotación más sostenible

Las tecnologías de datos como la visión por computadora pueden ayudar a las organizaciones a ver cosas que a los humanos se nos escapan. Esto puede ayudar con la crisis climática, ya que puede incluir el desperdicio de agua, el desperdicio de energía y los residuos de vertederos mal dirigidos.

El sector de la tecnología agrícola ya está aprovechando los datos y la IA, puesto que nuestros productores de alimentos y agricultores están sometidos a una presión extrema para producir más cosechas con menos agua. Por ejemplo, John Deere creó un robot llamado "See and Spray" que utiliza tecnología de visión por computadora para controlar y rociar herbicida en las plantas de algodón en cantidades precisas.

Trabajamos con PrecisionHawk para utilizar la visión por computadora combinada con la fotografía basada en drones para analizar cultivos y campos con el fin de ofrecer a los agricultores información precisa para gestionar mejor los cultivos. Los datos producidos gracias al proyecto de visión por computadora ayudaron a los agricultores a comprender tus necesidades y definir estrategias con mayor rapidez, lo que es fundamental en agricultura. (enlace al estudio de caso)

Asistencia sanitaria: Identificar y prevenir enfermedades

La IA tiene un importante papel que desempeñar en la atención sanitaria, con usos que van desde la asistencia telefónica al paciente hasta el diagnóstico y tratamiento de pacientes.

Por ejemplo, las empresas sanitarias están creando sistemas de apoyo a la toma de decisiones clínicas que avisan al médico con antelación cuando un paciente corre el riesgo de sufrir un infarto de miocardio o un ictus, lo que añade un tiempo crítico a su ventana de respuesta.

El aprendizaje electrónico asistido por IA también está ayudando a diseñar itinerarios de aprendizaje, sesiones de tutoría personalizadas, análisis de contenidos, marketing dirigido, calificación automática, etc. La IA tiene un papel que desempeñar a la hora de hacer frente a la necesidad crítica de formación sanitaria tras la escasez de personal sanitario.

La inteligencia artificial y el Machine Learning se perfilan como las tecnologías más revolucionarias del momento. Estos son algunos ejemplos que ponen de relieve el amplio uso y los beneficios de las tecnologías de datos en todos los sectores. La lista real de casos de uso y ejemplos es infinita y sigue creciendo.

¿Qué debe ocurrir para que su empresa triunfe en inteligencia artificial? Para obtener más información sobre inteligencia artificial y Machine Learning, póngase en contacto con nosotros hoy mismo. Kopius es líder en consultoría y servicios de tecnología digital nearshore.


Recursos adicionales:


Cuatro preguntas esenciales sobre los prejuicios de la IA


Por Hayley Pike

A medida que la IA se integra cada vez más en las empresas, también lo hace el sesgo de la IA.

El 2 de febrero de 2023, Microsoft publicó una declaración del vicepresidente y presidente Brad Smith sobre la IA responsable. A raíz de la nueva influencia de ChatGPT y Stable Diffusion, tener en cuenta la historia de los prejuicios raciales en las tecnologías de IA es más importante que nunca.

El debate en torno a los prejuicios raciales en la IA lleva años en marcha y, con él, han surgido indicios de problemas. Google despidió a dos de tus investigadores, el Dr. Timnit Gebru y la Dra. Margaret Mitchell, después de que publicaran artículos de investigación en los que se describía cómo la IA de reconocimiento facial y del lenguaje de Google tenía un sesgo en contra de las mujeres de color. Y el software de reconocimiento de voz de Amazon, Microsoft, Apple, Google e IBM identificó erróneamente el habla de personas negras en un 35%, en comparación con el 19% del habla de personas blancas.

En noticias más recientes, la empresa de tecnología DEI Textio analizó ChatGPT y demostró que se inclinaba a escribir anuncios de empleo para candidatos más jóvenes, hombres y blancos, y que el sesgo aumentaba en los anuncios de empleos más específicos.

Si está trabajando en un producto o proyecto de IA, debe tomar medidas para abordar el sesgo de la IA. Aquí tienes cuatro preguntas importantes para que tu IA sea más inclusiva:

  1. ¿Hemos incorporado evaluaciones éticas de la IA en el flujo de trabajo de producción desde el principio del proyecto? Los recursos de IA responsable de Microsoft incluyen una guía de evaluación de proyectos.
  2. ¿Estamos preparados para revelar los puntos fuertes y las limitaciones de nuestras fuentes de datos? La inteligencia artificial es tan sesgada como las fuentes de datos de las que se nutre. El proyecto debe revelar a quién priorizan los datos y a quién excluyen.
  3. ¿Es diverso nuestro equipo de producción de IA? ¿Cómo ha tenido en cuenta las perspectivas de las personas que utilizarán su producto de IA y que no están representadas en el equipo del proyecto o en la industria tecnológica?
  4. ¿Hemos escuchado a diversos expertos en IA? La Dra.Joy Buolamwini y la Dra. Inioluwa Deborah Raji, actualmente en el MIT Media Lab, son dos investigadoras negras pioneras en el campo del sesgo racial en la IA.

Rediet Adebe es informático y cofundador de Black in AI. Adebe lo resume así:

"La investigación en IA también debe reconocer que los problemas que queremos resolver no son puramente técnicos, sino que interactúan con un mundo complejo lleno de desafíos estructurales y desigualdades. Por lo tanto, es crucial que los investigadores de IA colaboren estrechamente con personas que posean formación y conocimientos especializados diversos."

Para obtener más información sobre inteligencia artificial y Machine Learning, póngase en contacto con nosotros hoy mismo. Kopius es líder en consultoría y servicios de tecnología digital nearshore.


Recursos adicionales:


ChatGPT y modelos de fundación: El futuro del trabajo asistido por IA


Por Yuri Brigance

El auge de modelos generativos como ChatGPT y Stable Diffusion ha generado mucho debate sobre el futuro del trabajo y el lugar de trabajo asistido por IA. Hay una gran expectación por las nuevas e impresionantes capacidades que promete esta tecnología, así como preocupación por la pérdida de puestos de trabajo a causa de la automatización. Veamos en qué punto nos encontramos hoy, cómo podemos aprovechar estas nuevas tecnologías de texto generadas por IA para potenciar la productividad y qué cambios pueden suponer para un lugar de trabajo moderno.

¿Te quitará el trabajo ChatGPT?

Es la pregunta que todo el mundo se hace. La IA puede generar imágenes, música, texto y código. ¿Significa esto que tu trabajo como diseñador, desarrollador o redactor está a punto de automatizarse? Pues sí. Tu trabajo se automatizará en el sentido de que será mucho más eficiente, pero tú seguirás al mando.

En primer lugar, no toda automatización es mala. Antes de que se generalizaran las computadoras, los impuestos se hacían con papel y lapicera. ¿Abandonaron los programas fiscales modernos el negocio de los contables? En absoluto. Facilitó su trabajo automatizando tareas repetitivas, aburridas y repetitivas. Los contables fiscales son ahora más eficientes que nunca y pueden centrarse en dominar la legislación fiscal en lugar de perder horas empujando papel. Se ocupan de casos fiscales más complicados, personalizados y adaptados a usted o a su empresa. Del mismo modo, es justo suponer que estas nuevas herramientas generativas de IA aumentarán los trabajos creativos y los harán más eficientes y agradables, no los suplantarán por completo.

En segundo lugar, los modelos generativos se entrenan con contenidos creados por humanos. Esto molesta a muchos, especialmente a los creadores, cuyas obras se utilizan como datos de entrenamiento sin el permiso explícito del artista, lo que permite al modelo replicar su estilo artístico único. Stability.ai planea resolver este problema permitiendo a los artistas optar por que tus obras no formen parte del conjunto de datos, pero, siendo realistas, no hay forma de garantizar el cumplimiento y no hay forma definitiva de demostrar si su arte se sigue utilizando para entrenar modelos. Pero esto abre interesantes oportunidades. ¿Qué pasaría si concedieras la licencia de tu estilo a una empresa de inteligencia artificial? Si eres un artista de éxito y tu trabajo tiene demanda, podría haber un futuro en el que concedieras licencias para que tu trabajo se utilizara como datos de entrenamiento y te pagaran cada vez que se generara una nueva imagen basada en tus creaciones anteriores. Es posible que los creadores de IA responsables puedan calcular el nivel de actualizaciones de gradiente durante el entrenamiento y el porcentaje de activación neuronal asociado a muestras específicas de datos para calcular cuánto de tu arte bajo licencia fue utilizado por el modelo para generar un resultado. Del mismo modo que Spotify paga una pequeña cantidad al músico cada vez que alguien reproduce una de tus canciones, o que sitios web como Flaticon.com pagan una cantidad al diseñador cada vez que se descarga uno de tus iconos. Resumiendo, es probable que pronto veamos controles más estrictos sobre cómo se construyen los conjuntos de datos de formación en lo que respecta a las obras con licencia frente al dominio público.

Veamos algunas implicaciones positivas de este lugar de trabajo y esta tecnología asistidos por IA en relación con algunas funciones creativas y cómo esta tecnología puede agilizar determinadas tareas.

Como diseñador de interfaz de usuario, cuando diseñas interfaces web y para móviles es probable que dediques mucho tiempo a buscar imágenes de archivo. Las imágenes deben ser relevantes para la empresa, tener los colores adecuados, dejar espacio para superponer texto, etc. Algunas imágenes pueden ser oscuras y difíciles de encontrar. Se pueden pasar horas buscando la imagen de archivo perfecta. Con la IA, basta con generar una imagen a partir de un texto. Puede pedir al modelo que cambie la iluminación y los colores. ¿Necesitas espacio para un título? Utiliza inpainting para despejar una zona de la imagen. ¿Necesitas añadir un elemento específico a la imagen, como un cucurucho de helado? Muéstrale a AI dónde lo quieres y lo integrará sin problemas. ¿Necesitas buscar códigos de colores RGB/HEX complementarios? Pídele a ChatGPT que genere algunas combinaciones.

¿Va a desaparecer el trabajo de los fotógrafos? Lo más probable es que no. Siguen apareciendo nuevos dispositivos y hay que incorporarlos periódicamente a los datos de formación. Si somos inteligentes a la hora de conceder licencias de estos activos con fines de capacitación, es posible que tengas  más ingresos que antes, ya que la IA puede utilizar una parte de tu imagen y pagarte una tarifa parcial por cada solicitud muchas veces al día, en lugar de que un usuario compre una licencia por vez. Sí, hay que trabajar para habilitar esta funcionalidad, por eso es importante plantearse las cosas ahora y trabajar hacia una solución que beneficie a todos. Pero los modelos generativos entrenados hoy estarán lamentablemente obsoletos dentro de diez años, así que los modelos seguirán necesitando nuevos datos del mundo real generados por humanos para mantener su relevancia. Las empresas de IA tendrán una ventaja competitiva si pueden obtener licencias de conjuntos de datos de alta calidad, y nunca se sabe cuáles de tus imágenes utilizará la IA; incluso podría averiguar qué fotos tomar más para maximizar ese flujo de ingresos.

Los ingenieros de software, especialmente los que trabajan en servicios profesionales, a menudo tienen que alternar entre varios lenguajes de programación. Incluso en el mismo proyecto, pueden utilizar Python, JavaScript / TypeScript y Bash al mismo tiempo. Es difícil cambiar de contexto y recordar todas las peculiaridades de la sintaxis de un lenguaje en particular. ¿Cómo hacer eficientemente un bucle for en Python vs Bash? ¿Cómo desplegar un Cognito User Pool con un autorizador Lambda usando AWS CDK? Acabamos googleando estos fragmentos porque trabajar con tantos lenguajes nos obliga a recordar conceptos de alto nivel en lugar de elementos sintácticos específicos. GitHub Gist existe con el único propósito de descargar fragmentos de código útil de la memoria local (tu cerebro) a un almacenamiento externo. Con tanto que aprender, y cosas en constante evolución, es más fácil ser consciente de que existe una técnica o algoritmo concreto (y dónde buscarlo) que recordarlo con insoportable detalle como si recitáramos un poema. Herramientas como ChatGPT integradas directamente en el IDE reducirían la cantidad de tiempo que los desarrolladores dedican a recordar cómo crear una nueva clase en un lenguaje que hace tiempo que no utilizan, cómo configurar la lógica de bifurcación o construir un script que mueva un montón de archivos a AWS S3. Podrían simplemente pedirle al IDE que rellene esta repetición de tareas para pasar a resolver los desafíos algorítmicos más interesantes.

Un ejemplo de cómo usar los decoradores de Python en ChatGPT . El texto y el fragmento de código de ejemplo son muy informativos.

Para los redactores, puede ser difícil superar el bloqueo del escritor que supone no saber por dónde empezar o cómo concluir un artículo. A veces resulta difícil describir de forma concisa un concepto complicado. ChatGPT puede ser útil en este sentido, sobre todo como herramienta para buscar rápidamente información aclaratoria sobre un tema. Aunque es justificada tener precaución, como ha demostrado recientemente Stephen Wolfram, CEO de Wolfram Alpha, que argumenta de forma convincente que las respuestas de ChatGPT no siempre deben tomarse al pie de la letra... Así que la clave está en investigar por tu cuenta. Así las cosas, el modelo de OpenAI suele ser un buen punto de partida para explicar un concepto y, como mínimo, puede ofrecer pistas para seguir investigando. Pero por ahora, los escritores siempre deben verificar tus respuestas. Recordemos también que ChatGPT no ha sido entrenado con ninguna información nueva creada después del año 2021, por lo que no está al tanto de las novedades sobre la guerra en Ucrania, las cifras actuales de inflación o las recientes fluctuaciones del mercado bursátil, por ejemplo.

En conclusión

Los modelos de base como ChatGPT y Stable Diffusion pueden aumentar y agilizar los flujos de trabajo, y aún están lejos de poder amenazar directamente un puesto de trabajo. Son herramientas útiles mucho más capaces que los modelos de aprendizaje profundo de enfoque espefício, y requieren cierto grado de supervisión y precaución. ¿Serán aún mejores estos modelos dentro de 5-10 años? Sin duda. Y para entonces, puede que nos hayamos acostumbrado a ellos y tengamos varios años de experiencia trabajando con estos agentes de IA, incluidas tus peculiaridades y errores.

Hay una cosa importante que debemos tener en cuenta sobre los Modelos Fundacionales y el futuro del lugar de trabajo asistido por IA: en el presente, la capacitación sigue siendo muy costosa. No están conectados a Internet y no pueden consumir información en tiempo real, en modo de entrenamiento incremental en línea. No hay una base de datos en la que cargar los nuevos datos, lo que significa que para incorporar nuevos conocimientos, el conjunto de datos debe crecer para encapsular la información reciente, y el modelo debe afinarse o volver a entrenarse desde cero en este conjunto de datos más grande. Es difícil verificar que el modelo produzca información objetivamente correcta, ya que el conjunto de datos de entrenamiento no está etiquetado y el procedimiento de entrenamiento no está totalmente supervisado. Hay alternativas interesantes de código abierto en el horizonte (como la StableDiffusion basada en U-Net), y técnicas para ajustar partes del modelo más grande a una tarea específica, pero éstas tienen un enfoque más específico, requieren cantidad de retoques con hiperparámetros, y en general están fuera del alcance de este artículo en particular.

Es difícil predecir exactamente dónde estarán los modelos básicos dentro de cinco años y cómo influirán en el lugar de trabajo asistido por IA, ya que el campo del Machine Learning evoluciona rápidamente. Sin embargo, es probable que los modelos básicos sigan mejorando en términos de precisión y capacidad para gestionar tareas más complejas. Por ahora, sin embargo, parece que aún nos queda algo de tiempo antes de preocuparnos seriamente por perder nuestros puestos de trabajo a manos de la IA. Deberíamos aprovechar esta oportunidad para mantener ahora conversaciones importantes que garanticen que el futuro desarrollo de estos sistemas tenga una trayectoria ética.

Para obtener más información sobre nuestras soluciones de IA generativa, póngase en contacto con nosotros hoy mismo. Kopius es líder en consultoría y servicios de tecnología digital nearshore.


Recursos adicionales:


¿Qué diferencia a los modelos ChatGPT y Foundation de los modelos habituales de IA?


Por Yuri Brigance

Aquí se presenta lo que separa a los modelos fundacionales de los modelos habituales de IA. Exploramos las razones por las que estos modelos son difíciles de entrenar y cómo entenderlos en el contexto de los modelos de IA más tradicionales.

Modelo de fundación chatGPT

¿Qué son los Modelos Fundacionales?

¿Qué son los modelos básicos y en qué se diferencian de los modelos tradicionales de IA de aprendizaje profundo? El Centro de IA Centrada en el Ser Humano del Instituto Stanford define un modelo básico como "cualquier modelo entrenado con datos amplios (generalmente utilizando autosupervisión a escala) que puede adaptarse a una amplia gama de tareas posteriores". Esto describe también muchos modelos estrechos de IA, como MobileNets y ResNets, que también pueden ajustarse y adaptarse a distintas tareas.

Las distinciones clave aquí son "autosupervisión a escala" y "amplia gama de tareas".

Los modelos Foundation se entrenan con cantidades ingentes de datos sin etiquetar o semietiquetados, y el modelo contiene órdenes de magnitud más de parámetros entrenables que un modelo de aprendizaje profundo típico destinado a ejecutarse en un smartphone. Esto hace que los modelos básicos sean capaces de generalizarse a una gama mucho más amplia de tareas que los modelos más pequeños entrenados en conjuntos de datos específicos del dominio. Es un error común pensar que arrojar muchos datos a un modelo hará que de repente haga algo útil sin más esfuerzo. En realidad, estos modelos de gran tamaño son muy buenos para encontrar y codificar patrones intrincados en los datos con poca o ninguna supervisión, patrones que pueden explotarse de diversas formas interesantes, pero es necesario realizar una buena cantidad de trabajo para utilizar este conocimiento oculto aprendido de forma útil.

La arquitectura de los modelos básicos de IA

El aprendizaje no supervisado, semisupervisado y por transferencia no son conceptos nuevos y, hasta cierto punto, los modelos de fundamentos también entran en esta categoría. Estas técnicas de aprendizaje se remontan a los inicios de los modelos generativos, como las máquinas de Boltzmann restringidas y los autocodificadores. Estos modelos más sencillos constan de dos partes: un codificador y un descodificador. El objetivo de un autocodificador es aprender una representación compacta (conocida como codificación o espacio latente) de los datos de entrada que capte los rasgos o características importantes de los datos, lo que se conoce como "separación lineal progresiva" de los rasgos que definen los datos. Esta codificación puede utilizarse después para reconstruir los datos de entrada originales o generar datos sintéticos completamente nuevos introduciendo variables latentes modificadas de forma inteligente en el descodificador.

Un ejemplo de arquitectura de un modelo autoencodificador convolucional de imágenes se entrena para reconstruir su propia entrada, por ejemplo: imágenes. La modificación inteligente del espacio latente permite generar imágenes completamente nuevas. Esto se puede ampliar añadiendo un modelo adicional que codifique las indicaciones de texto en representaciones latentes que el descodificador entienda para permitir la funcionalidad de texto a imagen.

Muchos modelos modernos de ML utilizan esta arquitectura, y la parte del codificador se denomina a veces columna vertebral, mientras que el decodificador se denomina cabeza. A veces los modelos son simétricos, pero con frecuencia no lo son. Muchas arquitecturas de modelos pueden servir como codificador o columna vertebral, y el resultado del modelo puede adaptarse a un problema específico modificando el decodificador o la cabeza. No hay límite en el número de cabezas que puede tener un modelo, ni en el número de codificadores. Las columnas vertebrales, las cabezas, los codificadores, los decodificadores y otras abstracciones de alto nivel son módulos o bloques construidos a partir de múltiples capas lineales, convolucionales y de otros tipos de redes neuronales básicas. Podemos intercambiarlas y combinarlas para producir diferentes arquitecturas de modelos a medida, del mismo modo que utilizamos diferentes marcos y bibliotecas de terceros en el desarrollo de software tradicional. Esto, por ejemplo, nos permite codificar una frase en un vector latente que luego puede descodificarse en una imagen.

Modelos básicos para el procesamiento del lenguaje natural

Los modelos modernos de Procesamiento del Lenguaje Natural (PLN) como ChatGPT entran en la categoría de Transformadores. El concepto de transformador se introdujo en el artículo de 2017 "Attention Is All You Need" de Vaswani et al. y desde entonces se ha convertido en la base de muchos modelos de vanguardia en PNL. La innovación clave del modelo transformador es el uso de mecanismos de autoatención, que permiten al modelo sopesar la importancia de las diferentes partes de la entrada al hacer predicciones. Estos modelos utilizan lo que se denomina una "incrustación", que es una representación matemática de una entrada discreta, como una palabra, un carácter o un fragmento de imagen, en un espacio continuo de alta dimensión. Las incrustaciones se utilizan como entrada para los mecanismos de autoatención y otras capas del modelo transformador para realizar la tarea específica que se esté llevando a cabo, como la traducción de idiomas o el resumen de textos. ChatGPT no es el primero ni el único modelo de transformador que existe. De hecho, los transformadores se han aplicado con éxito en muchos otros ámbitos, como la visión por computadora y el procesamiento de sonido.

Entonces, si ChatGPT se construye sobre conceptos ya existentes, ¿qué lo hace tan diferente de todas las demás arquitecturas de modelos de última generación que ya se utilizan hoy en día? Una explicación simplificada de lo que distingue a un modelo básico de un modelo de aprendizaje profundo "normal" es la inmensa escala del conjunto de datos de entrenamiento, así como el número de parámetros entrenables que tiene un modelo básico en comparación con un modelo generativo tradicional. Una red neuronal excepcionalmente grande entrenada en un conjunto de datos verdaderamente masivo proporciona al modelo resultante la capacidad de generalizarse a una gama más amplia de casos de uso que tus hermanos más estrechamente enfocados, sirviendo así de base para un número incalculable de nuevas tareas y aplicaciones. Un modelo tan amplio codifica muchos patrones, características y relaciones útiles en tus datos de entrenamiento. Podemos extraer este acervo de conocimientos sin necesidad de volver a entrenar toda la parte codificadora del modelo. Podemos acoplar diferentes cabezas nuevas y utilizar técnicas de aprendizaje por transferencia y de ajuste fino para adaptar el mismo modelo a diferentes tareas. Así es como un solo modelo (como Stable Diffusion) puede realizar a la vez tareas de conversión de texto en imagen, de imagen en imagen, de repintado, de superresolución e incluso de generación de música.

Desafíos en la formación de Modelos Fundacionales

La potencia de cálculo de la GPU y los recursos humanos necesarios para entrenar desde cero un modelo básico como GPT eclipsan los disponibles para desarrolladores individuales y equipos pequeños. Los modelos son sencillamente demasiado grandes y el conjunto de datos demasiado difícil de manejar. Estos modelos no pueden (por ahora) entrenarse de forma rentable de principio a fin y repetirse utilizando hardware básico.

Aunque los conceptos pueden estar bien explicados por la investigación publicada y entendidos por muchos científicos de datos, las habilidades de ingeniería y los costos exorbitantes necesarios para conectar cientos de nodos de GPU durante meses a la vez estirarían los presupuestos de la mayoría de las organizaciones. Y eso sin tener en cuenta los costos de acceso a los conjuntos de datos, almacenamiento y transferencia de datos asociados a la alimentación del modelo con cantidades masivas de muestras de entrenamiento.

Hay varias razones por las que modelos como ChatGPT están actualmente fuera del alcance de los particulares para formarse:

  1. Datos necesarios: El entrenamiento de un gran modelo lingüístico como ChatGPT requiere una cantidad masiva de datos de texto. Estos datos deben ser de alta calidad y diversos, y suelen obtenerse de diversas fuentes, como libros, artículos y sitios web. Estos datos también se preprocesan para obtener el mejor rendimiento, lo que supone una tarea adicional que requiere conocimientos y experiencia. Los costos de almacenamiento, transferencia de datos y carga de datos son tustancialmente más elevados que los que se utilizan para modelos con un enfoque más limitado.
  2. Recursos informáticos: ChatGPT requiere importantes recursos informáticos para entrenarse. Esto incluye clústeres en red de potentes GPU y una gran cantidad de memoria volátil y no volátil. La ejecución de un clúster informático de este tipo puede alcanzar fácilmente los cientos de miles por experimento.
  3. Tiempo de formación: Entrenar un modelo básico puede llevar varias semanas o incluso meses, dependiendo de los recursos informáticos disponibles. Cablear y alquilar tantos recursos requiere mucha habilidad y un generoso compromiso de tiempo, por no hablar de los costos de computación en la nube asociados.
  4. Experiencia: Para llevar a buen término un curso de formación se requieren conocimientos de Machine Learning, procesamiento del lenguaje natural, ingeniería de datos, infraestructura en la nube, redes y mucho más. La mayoría de las personas no pueden adquirir fácilmente este amplio conjunto de competencias interdisciplinares.

Acceso a modelos de IA preentrenados

Dicho esto, hay modelos preentrenados disponibles, y algunos pueden ajustarse con una menor cantidad de datos y recursos para un conjunto de tareas más específico y reducido, lo que constituye una opción más accesible para particulares y organizaciones más pequeñas.

El entrenamiento de Stable Diffusion requirió 600.000 dólares, el equivalente a 150.000 horas de GPU. Es decir, un cluster de 256 GPUs funcionando 24 horas al día, 7 días a la semana durante casi un mes. Stable Diffusion se considera una reducción de costos en comparación con GPT. Por lo tanto, aunque es posible entrenar tu propio modelo de base utilizando proveedores de nube comerciales como AWS, GCP o Azure, el tiempo, el esfuerzo, la experiencia necesaria y el costo total de cada iteración imponen limitaciones a su uso. Existen muchas soluciones y técnicas para reutilizar y volver a entrenar parcialmente estos modelos, pero por ahora, si quieres entrenar tu propio modelo básico desde cero, lo mejor que puedes hacer es solicitarlo a una de las pocas empresas que tienen acceso a los recursos necesarios para llevar a cabo esta tarea.

Comunicate con nosotros

Si está listo para aprovechar la inteligencia artificial y las soluciones de aprendizaje automático, póngase en contacto con nosotros hoy mismo. Kopius es líder en consultoría y servicios de tecnología digital nearshore.


Recursos adicionales:


Tendencias de datos: Seis formas en que los datos cambiarán los negocios a partir de 2023


Por Kristina Scott

La cantidad de datos es enorme y crece cada vez más. Hemos rastreado seis grandes tendencias basadas en datos para el año que viene.

Analítica digital visualización de datos, calendario financiero, monitor de pantalla en perspectiva

Los datos son una de las oportunidades más innovadoras y de mayor crecimiento en la actualidad para dar forma a nuestra forma de trabajar y liderar. IDC predice que, para 2024, la incapacidad de llevar a cabo una estrategia basada en los datos y la IA afectará negativamente al 75 % de las mayores empresas públicas del mundo. Y para 2025, el 50% de esas empresas promoverán la toma de decisiones basada en datos mediante la integración de análisis en su software empresarial (frente al 33% en 2022), lo que impulsará la demanda de más soluciones de datos y empleados expertos en datos.

Aquí mostramos cómo cambiarán las tendencias de datos a partir de 2023:

  1. La democratización de los datos impulsa la cultura de datos

Si cree que los datos sólo son relevantes para los analistas con conocimientos avanzados de ciencia de datos, tenemos noticias para usted. La democratización de los datos es una de las tendencias más importantes en materia de datos. El estudio de Gartner prevé que el 80 % de las iniciativas basadas en datos que se centran en los resultados empresariales se convertirán en funciones empresariales esenciales en 2025.

Las organizaciones están creando una cultura de datos mediante la atracción de talentos expertos en datos y la promoción del uso de datos y la educación de los empleados a todos los niveles. Para apoyar la democratización de los datos, estos deben ser exactos, fáciles de digerir y accesibles.

Según un estudio de McKinsey, las empresas con mejores resultados cuentan con un responsable de datos en la dirección ejecutiva y ponen los datos y las herramientas de autoservicio al alcance de todos los empleados de primera línea.

2. La hiperautomatización y los datos en tiempo real reducen los costos

Los datos en tiempo real y su automatización serán las herramientas de big data más valiosas para las empresas en los próximos años. Gartner prevé que, para 2024, la hiperautomatización rápida permitirá a las organizaciones reducir los costos operativos en un 30 %. Y para 2025, el mercado de software de hiperautomatización alcanzará casi los 860.000 millones de dólares.

3. La inteligencia artificial y el Machine Learning (IA y ML) siguen revolucionando las operaciones

La capacidad de implementar IA y ML en las operaciones será un diferenciador significativo. Verta Insights descubrió que los líderes del sector que superan financieramente a tus homólogos tienen más del doble de probabilidades de lanzar proyectos, productos o funciones de IA y han realizado inversiones en IA/ML a un nivel superior que tus homólogos.

Las tecnologías de IA y ML impulsarán el mercado del procesamiento del lenguaje natural (PLN). El PLN permite a las máquinas comprender el lenguaje humano hablado y escrito y comunicarse con nosotros. Según un estudio de MarketsandMarkets, el tamaño del mercado del PLN pasará de 15.700 millones de dólares en 2022 a 49.400 millones en 2027.

Hemos asistido a la oleada de interés por ChatGPT de OpenAI, un software de generación de lenguaje conversacional. Esta tecnología altamente escalable podría revolucionar toda una serie de casos de uso, desde resumir cambios en documentos legales hasta cambiar por completo nuestra forma de buscar información a través de interacciones similares al diálogo, afirma CNBC.

Esto puede tener implicaciones en muchas industrias. Por ejemplo, el sector sanitario ya emplea la IA para recomendaciones de diagnóstico y tratamiento, participación de los pacientes y tareas administrativas. 

4. La arquitectura de datos conduce a la modernización

La arquitectura de datos acelera la transformación digital porque resuelve problemas de datos complejos mediante la automatización de procesos de datos básicos, aumenta la calidad de los datos y minimiza los silos y los errores manuales. Las empresas se modernizan apoyándose en la arquitectura de datos para conectar datos entre plataformas y usuarios. Las empresas adoptarán nuevo software, agilizarán las operaciones, encontrarán mejores formas de utilizar los datos y descubrirán nuevas necesidades tecnológicas.

Según MuleSoft, las organizaciones están preparadas para automatizar la toma de decisiones, mejorar dinámicamente el uso de los datos y reducir los esfuerzos de gestión de datos hasta en un 70% mediante la incorporación de análisis en tiempo real en su arquitectura de datos.

5. Las soluciones multi-nube optimizan el almacenamiento de datos

El uso de la nube se está acelerando. Las empresas optarán cada vez más por una nube híbrida, que combina los mejores aspectos de las nubes privadas y públicas.

Las empresas pueden acceder a los datos recopilados por servicios en la nube de terceros, lo que reduce la necesidad de crear sistemas personalizados de recopilación y almacenamiento de datos, que suelen ser complejos y caros.

En el Informe sobre el estado de la nube de Flexera, el 89% de los encuestados tiene una estrategia multi-nube, y el 80% está adoptando un enfoque híbrido.

6. Una mejor gobernanza y regulación de los datos protegen a los usuarios

Una gobernanza de datos eficaz se convertirá en la base de unos datos impactantes y valiosos. 

A medida que más países aprueben leyes para regular el uso de diversos tipos de datos, la gobernanza de datos pasa a un primer plano en las prácticas de datos. El GDPR europeo, la PIPEDA canadiense y la PIPL china no serán las últimas leyes que se introduzcan para proteger los datos de los ciudadanos.

Gartner ha pronosticado que en 2023 el 65 % de la población mundial estará sujeta a normativas como el GDPR. A su vez, será más probable que los usuarios confíen tus datos a las empresas si saben que están más reguladas.

Valence trabaja con tus clientes para implementar un marco de gobernanza, encontrar fuentes de datos y riesgos de datos, y activar la organización en torno a este enfoque innovador de la gobernanza de datos y procesos, incluyendo educación, formación y desarrollo de procesos. Más información.

Qué aportan estas tendencias de datos

A medida que transcurre
 2023, las organizaciones que comprenden las tendencias actuales de los datos pueden aprovecharlos para ser más innovadoras, estratégicas y adaptables. Nuestro equipo ayuda a los clientes con evaluaciones de datos, diseñando y estructurando activos de datos y creando soluciones modernas de gestión de datos. Integramos estratégicamente los datos en los negocios de los clientes, utilizamos el Machine Learning y la inteligencia artificial para crear perspectivas proactivas, y creamos visualizaciones de datos y cuadros de mando para que los datos tengan sentido.  

Ayudamos a nuestros clientes a desarrollar una solución y crear una arquitectura de datos moderna que admita una escalabilidad diferenciada habilitada para la nube, capacidad de autoservicio y un plazo de comercialización más rápido para nuevos productos y soluciones de datos. Más información.

Recursos adicionales:


Mujeres y tecnología - Aravinda Gollapudi


"La tecnología es un instrumento que cambiará la sociedad. Las mujeres tienen un papel en cómo se utiliza esa tecnología y cómo cambiará la sociedad". Aravinda Gollapudi, Directora de Plataforma y Tecnología de Sage

Nos sentamos con Aravinda Gollapudi, Directora de Plataforma y Tecnología de Sage, una empresa de 2.000 millones de dólares que proporciona a las pequeñas y medianas empresas software de finanzas, recursos humanos y nóminas. En Sage, dirige una organización distribuida por todo el mundo de unos 270 empleados que se ocupan de productos, tecnología, gestión de versiones, gestión de programas y mucho más. Aravinda también completa su trabajo técnico como consejera de Artifcts y Loopr.

Hablamos con Aravinda de tecnología y de cómo encajan las mujeres en esta industria. Compartimos lo más importante de ese intercambio. 

¿Cuál es su papel en la tecnología? ¿Qué hace hoy?

Creo un modelo operativo para que las plataformas, los procesos y las organizaciones combinen velocidad y escala. Esto impulsa el liderazgo en el mercado y las soluciones innovadoras al tiempo que acelera la velocidad a través de la estructura organizativa. Para ello, lidero la organización tecnológica de servicios financieros nativos en la nube para el mercado medio en Sage, al tiempo que dirijo la hoja de ruta de productos y la estrategia para la plataforma como líder de la unidad de negocio.

También asesoro, sirvo de mentor y colaboro con directores ejecutivos de empresas emergentes como asesor del consejo en torno a tecnologías como IA/ML, SAAS, nube, estrategia organizativa y modelos de negocio. También ayudo a reunir a mi red para impulsar las actividades de salida al mercado.

Mi función me brinda una oportunidad única de impulsar la convergencia de los resultados empresariales y los habilitadores de tecnología/inversión mediante la identificación, el diseño y el liderazgo de soluciones para el mercado, para hoy, para mañana y para el futuro.

¿Cómo empezó en el mundo de la tecnología?

Creo que mi inclinación hacia la tecnología puede atribuirse a mi interés por las matemáticas. Tengo edad suficiente para apreciar cómo los ordenadores personales impulsaron la adopción exponencial de la tecnología.

La actual generación de tecnólogos tiene a su alcance una inmensa potencia informática, pero yo empecé mi incursión en la tecnología cuando tenía que utilizar servidores UNIX para hacer mi trabajo.

Al principio de mi career, quise dedicarme al mundo académico y a la investigación en física. Tras licenciarme en Física, me dediqué a la investigación en óptica cuántica. Pasé mucho tiempo programando modelos en lenguaje Fortran, que se utiliza en la informática científica. Fortran me introdujo en la programación informática.

Mi interés por la tecnología aumentó mientras cursaba mi segundo máster en Ingeniería Informática. Aunque estudiaba hardware y software, me incliné por la programación de software.

¿Qué puede decirnos de las personas que le allanaron el camino? ¿Cómo influyeron los mentores en su éxito?

Gran parte de mi carrera la forjaron muy pronto mis padres, que son profesores. Me inculcaron la importancia del aprendizaje y del trabajo. Mi padre fue profesor y director de escuela, y fue un modelo a seguir con respecto a la ética del trabajo, la disciplina, el respeto y el valor. Mi madre, con tus múltiples másteres y su afán de aprendizaje continuo, nos enseñó que era importante seguir aprendiendo.

Más adelante en mi career, tuve la suerte de contar con el apoyo de mis jefes, mentores y colegas. Los aproveché para aprender el oficio en torno al software, pero también en torno al diseño organizativo, la estrategia de producto y el liderazgo en general. Tengo la suerte de contar con mentores que me retaron a ser mejor y a vigilar mis errores. Todavía hoy me apoyo en ellos. Algunos de mis mentores son Christine Heckart, Jeff Collins, Himanshu Baxi, Keith Olsen y Kathleen Wilson. Han sido mis jefes o mentores, me han dado información sincera, me han motivado y me han ayudado a desarrollar mis dotes de liderazgo.

Sería negligente si no mencionara el apoyo y el ánimo de mi marido. Siempre me ha empujado a asumir desafíos y me ha apoyado mientras compaginábamos familia y trabajo.

¿Cómo podemos mejorar la tecnología para las mujeres?

Si queremos mejorar la tecnología para las mujeres, debemos invertir en las chicas tecnólogas. Los responsables de contratación deben superar los prejuicios inconscientes y crear oportunidades para las chicas en career .

La tutoría es crucial: Tenemos que reconocer que el aprendizaje y la trayectoria profesional suelen ser diferentes para las mujeres. Tener un mentor fuerte, independientemente del sexo, ayuda a las mujeres a aprender a enfrentarse a las situaciones y a desarrollar su career. Las mujeres líderes que pueden asumir este papel de compartir su experiencia y servir de mentoras a las estrellas en ciernes ayudará a las que no tienen un camino recto en tus carreras.

Dado el menor porcentaje de mujeres representadas en la tecnología, me alegra ver la tendencia en los últimos tiempos a elevar este tema a todos los niveles. Al convertirse en mentores, los defensores de la diversidad pueden tener un impacto real en la mejora de la tendencia.

Tenemos que invertir en alianzas y tutoría y destacar la importancia de la diversidad de género. Por ejemplo, en el caso de los consejos de administración, organizaciones como 50/50 Women on Boards destacan el valor de la diversidad de género y trabajan en el apoyo legislativo. Necesitamos más de eso o, de lo contrario, dejaremos atrás a la mitad de la población.

¿Qué le gustaría que supiera más gente para apoyar a las mujeres en la tecnología?

Ojalá más gente comprendiera el impacto del sesgo inconsciente. La mayoría de la gente no tiene intención de tenerlo, pero la naturaleza humana hace que nos inclinemos por determinadas decisiones o acciones. La industria tecnológica mejoraría mucho si más gente tomara medidas sencillas para evitar su sesgo inconsciente, como tomar decisiones en varios entornos (evitando el impacto de la hora del día), ver que los nombres y los acentos no influyan en las decisiones de contratación e invertir en diversidad.

¿Qué es lo próximo en tecnología? ¿Qué tendencias le entusiasman?

Hay tres tendencias importantes que me entusiasman en este momento: la Inteligencia Artificial/Machine Learning, datos y tecnología sostenible.

Vivimos en el mundo de la IA en todas partes y aún hay más por llegar. Cinco de cada seis estadounidenses utilizan servicios de IA todos los días. Espero que la IA siga dando forma a la automatización y a las interacciones inteligentes, y mejore la eficiencia.

También es un momento apasionante para trabajar con datos. Avanzamos hacia un mundo digital hiperconectado, y la antigua forma de hacer las cosas nos obligaba a aprovechar enormes cantidades de datos digitales procedentes de fuentes aisladas. La tendencia avanza hacia la creación de redes y conexiones que impulsarán interacciones más complejas entre máquinas. Esta conectividad de datos afectará a nuestras vidas en el hogar, la escuela, la oficina, etc., y cambiará radicalmente nuestra forma de hacer negocios.

Y estoy especialmente entusiasmado con las tendencias en tecnología sostenible. Veremos más inversiones en tecnologías que reducen el impacto de la tecnología hambrienta de computación. Preveo una evolución hacia inversiones más sostenibles desde el punto de vista medioambiental, que nos ayudarán a reducir el uso de recursos derrochadores como los centros de datos, el almacenamiento y la informática.

¿Qué necesita ahora más que nunca el mundo de la tecnología?

El mundo de la tecnología necesita una mayor seguridad de los datos y más diversidad.

Los datos son muy accesibles en nuestras vidas (en parte gracias a las redes sociales), por lo que necesitamos más inversión en privacidad y seguridad. Ya hemos visto el impacto de esta necesidad en la vida personal, el panorama político y las empresas.

Durante demasiado tiempo, no hemos invertido lo suficiente en diversidad, por lo que tenemos mucho que recuperar. En el mundo de la tecnología, estamos lamentablemente rezagados en cuanto a diversidad en los puestos de liderazgo, sobre todo en el sector tecnológico estadounidense, donde alrededor del 20% de los puestos de liderazgo tecnológico están ocupados por mujeres.

Los datos son omnipresentes, las herramientas y los marcos de trabajo están al alcance de la mano y la tecnología se estudia antes en las escuelas, cada vez son más jóvenes quienes se inician en la creación de productos y aplicaciones tecnológicas. Hemos reducido la barrera de entrada (lenguajes, marcos de trabajo, conjuntos de herramientas de bajo código o sin código) para facilitar la adopción de la tecnología sin la sobrecarga de cursos complejos. Con todas estas mejoras, ¿por qué seguimos tan retrasados en materia de diversidad? En el sector tecnológico estadounidense, el 62% de los puestos de trabajo están ocupados por estadounidenses blancos. Los asiático-americanos ocupan el 20% de los puestos. Los latinoamericanos ocupan el 8% de los puestos. Los negros ocupan el 7% de los puestos. Sólo el 26,7% de los empleos tecnológicos están ocupados por mujeres.

Tenemos las herramientas y la formación. Ahora tenemos que cambiar el perfil de la mano de obra para incluir a una comunidad más diversa.

¿Qué consejo le daría a quien lea esto?

A las mujeres que estén leyendo esto, les animo encarecidamente a que eviten las dudas sobre sí mismas y ganen confianza armándose de conocimientos y mentores. Si sacamos lo mejor de nosotras mismas, podremos centrarnos en las oportunidades y no en los obstáculos. La tecnología es un facilitador que cambiará las reglas del juego en la configuración de la sociedad. Las mujeres tienen un papel que desempeñar en el uso de esa tecnología y en el cambio de la sociedad.

Recursos adicionales