Aprendizaje profundo

Entradas

LLM Large Language Models: Desafios

julio 22, 2023

La tokenización es un proceso simple que toma datos sin procesar y los convierte en una cadena de datos útil. Si bien la tokenización es bien conocida por su uso en ciberseguridad y en la creación de NFT, la tokenización también es una parte importante del proceso NLP. La tokenización se utiliza en el procesamiento del lenguaje natural para dividir párrafos y oraciones en unidades más pequeñas a las que se les puede asignar un significado más fácilmente. El primer paso del proceso de PNL es recopilar los datos (una oración) y dividirlos en partes comprensibles (palabras). Aquí un ejemplo de una cadena de datos: “¿Qué restaurantes hay cerca? “ Para que una máquina entienda esta oración, se realiza tokenización en la cadena para dividirla en partes individuales. Con la tokenización, obtendríamos algo como esto: 'qué' 'restaurantes' 'son' 'cercanos' Esto puede parecer simple, pero dividir una oración en sus partes permite que una máquina ent...

Foundation models

mayo 25, 2023

Modelo base (Foundation Model) es un gran modelo de inteligencia artificial entrenado en una gran cantidad de datos a escala (a menudo mediante aprendizaje autosupervisado o aprendizaje semisupervisado ) que da como resultado un modelo que se puede adaptar a una amplia gama de tareas posteriores. Los modelos básicos han ayudado a lograr una gran transformación en la forma en que se construyen los sistemas de IA, por ejemplo, al impulsar destacados chatbots y otras IA orientadas al usuario. El Instituto Stanford popularizó el término. Los primeros ejemplos de modelos básicos fueron modelos de lenguaje grande (LLM) preentrenados, incluido el BERT y varios modelos GPT. Dichos modelos amplios pueden, a su vez, usarse para modelos específicos de tareas y/o dominios utilizando secuencias de otros tipos de tokens, como códigos médicos. Más allá del texto, se han producido varios modelos básicos visuales y multimodales, incluidos DALL-E , Flamingo, Florence y NOOR. Los m...

Prompt Engineering

mayo 21, 2023

La ingeniería de prompt es una disciplina relativamente nueva para desarrollar y optimizar avisos para usar modelos de lenguaje (LM) de manera eficiente para una amplia variedad de aplicaciones y temas de investigación. Las habilidades de ingeniería rápidas ayudan a comprender mejor las capacidades y limitaciones de los modelos de lenguaje extenso (LLM). Los investigadores utilizan la ingeniería de prompt para mejorar la capacidad de los LLM en una amplia gama de tareas comunes y complejas, como la respuesta a preguntas y el razonamiento aritmético. Los desarrolladores utilizan la ingeniería de prompt para diseñar técnicas de avisos sólidas y eficaces que interactúan con los LLM y otras herramientas. La ingeniería de prompt no se trata solo de diseñar y desarrollar prompt . Abarca una amplia gama de habilidades y técnicas que son útiles para interactuar y desarrollarse con LLM. Es una habilidad importante interactuar, desarrollar y comprender las ca...

Entrenamiento e inferencia

mayo 16, 2023

¿Qué es el entrenamiento de la IA? Inicialmente se le da a la IA un conjunto de datos con las etiquetas correctas, conocidos como datos de entrenamiento. Luego, se monitorea el modelo de inferencia generado por el conjunto de datos de prueba, al que la IA puede responder de manera veraz o falsa. Lo que se busca con este método de aprendizaje es detectar patrones, y lo que hace la IA en este caso es buscar y agrupar los datos en función de su similitud. Es el tipo de formación más utilizado en el procesamiento de datos multimedia. En este modelo el conjunto de datos de entrenamiento es introducido en tiempo real y las conclusiones que saca la IA son evaluadas por un agente supervisor que la alimenta, que puede ser una persona, una base de datos compleja e incluso otra IA. En este caso, la IA productiva no sabe lo que está buscando desde el principio, y solo aprende de una segunda IA que puede realizar la evaluación por clasificación o búsqueda de patrones. Dependiendo del tipo de...

¿Qué es la Inteligencia Artificial Generativa?

mayo 11, 2023

La Inteligencia Artificial Generativa es aquella que está destinada a crear nuevos contenidos, como por ejemplo podrían ser textos, imagenes, vídeos, códigos etc. Basándose en aprendizajes anteriores. Por lo que estas nuevas creaciones pueden ser muy útiles para la industria del entretenimiento, publicidad, salud, metaversos etc. Tipos de algoritmos se emplean para la IA Generativa Actualmente la mayoría de programas que emplean esta técnica, utilizan redes neuronales, lo que conlleva a un gran coste de hardware (Tarjetas gráficas) y coste energético, con su correspondiente contaminación. Generative Adversarial Network (GAN) : se emplean dos redes neuronales diferentes, una para crear los nuevos contenidos y la otra para determinar la calidad de este contenido. Las mayores desventajas de este tipo de redes, es que requieren de un entrenamiento muy sensible y que pueden generar resultados muy parecidos a otros creados con anterioridad. Implementaciones: DCGAN, ProGAN, BigGAN ...

Paradigmas del aprendizaje

mayo 11, 2023

Paradigmas Supervised Learning El enfoque de aprendizaje supervisado en el ML utiliza conjuntos de datos etiquetados que entrenan algoritmos para clasificar datos o predecir salidas con precisión. El modelo utiliza los datos etiquetados para medir la relevancia de las diferentes características a fin de mejorar gradualmente el ajuste del modelo al resultado conocido. Unsupervised Learning Con el aprendizaje no supervisado, se utilizan algoritmos de ML para examinar y agrupar los conjuntos de datos no etiquetados. Dichos algoritmos pueden descubrir patrones desconocidos en los datos sin supervisión humana. Self Supervised Learning El aprendizaje autosupervisado (SSL) es un paradigma de aprendizaje automático en el que un modelo, cuando se alimenta con datos no estructurados como entrada, genera etiquetas de datos automáticamente, que se utilizan en iteraciones posteriores como verdades básicas. La idea fundamental para el aprendizaje autosupervisado es generar señales de supervisi...

¿Que es el entrenamiento?

mayo 11, 2023

Entrenamiento de modelos de ML El proceso de entrenamiento de un modelo de ML consiste en proporcionar datos de entrenamiento de los cuales aprender a un algoritmo de ML (es decir, el algoritmo de aprendizaje). El término modelo de ML se refiere al artefacto de modelo que se crea en el proceso de entrenamiento. Los datos de entrenamiento deben contener la respuesta correcta, que se conoce como destino o atributo de destino. El algoritmo de aprendizaje encuentra patrones en los datos de entrenamiento que asignan los atributos de los datos de entrada al destino (la respuesta que desea predecir) y genera un modelo de ML que captura dichos patrones. Puede utilizar el modelo de ML para obtener predicciones sobre datos nuevos para los que no se conoce la respuesta de destino. Por ejemplo, si desea entrenar un modelo de ML para que prediga si un mensaje de correo electrónico es spam o no. Le proporcionaría datos de entrenamiento a Amazon ML que contienen correos electrónicos para los que...