En tiempos en que Sputnik todavía se presentaba como una alternativa a Selecciones del Reader’s Digest, mi viejo me regaló uno de mis primeros textos de tecnología: «El ABC de la Cibernética», de V. Kasatkin, lectura ideal para el ómnibus si ya habías completado una novela y querías cambiar un poco de aire. Quiero decir: números. Empezaba a probarme calculando, y festejaba mis aciertos de cuentas en hexadecimal verificando en la recién llegada calculadora científica, tosco ejercicio de aprendizaje por refuerzo.
Entre as histórias de viagens estelares e as conquistas da humanidade, outros textos bastante para-científicos previam que nos anos noventa se realizariam viagens regulares em zepelins de hélio, que nos mostrariam a Amazônia de cima, e que até lá o homem estaria construindo seus primeiros apartamentos em Marte. Demorei alguns anos, mas vi que isso não aconteceria. Assim, comecei a antecipar que algumas profecias se realizariam, e outras definitivamente nunca(classificação semi-supervisionada).
Em uma loja de computadores, alguém notou que quem comprava disquetes sempre carregava um certo acessório que começou a se tornar popular, ou seja, este senhor inferiu uma regra de associação. Assim, sua intuição o levou a oferecer uma combinação inovadora para a época: dez disquetes mais o dobro da capacidade, algo que hoje sugeriria qualquer sistema de recomendação sob estas hipóteses.
Esses hobbies transformados em interesses estavam delineando uma possível direção para mim como estudante. Diante das questões colocadas por uma carreira tão nova, observei(análise dos sentimentos) que minha mãe, preocupada, tinha algumas dúvidas sobre sua viabilidade. Pude entender(extração do tópico) que ela estava me sugerindo que me preparasse para um caminho alternativo, a fim de competir em alguma chamada para um trabalho previsivelmente estável(análise de séries temporais) e de segurança notória(agrupamento). Mas eu não mudei de idéia.
Dizem que há alguns anos atrás eles viram o DeLorean do McFly passar. Não sei se acredito, porque antes disso, eu tinha visto todas as notícias diárias em 1987 e não conseguia encontrar uma única notícia sobre Buck Rogers indo para o espaço. Talvez meu assistente virtual(discurso ao texto) possa lançar alguma luz sobre isto; eu vou perguntar-lhe(resposta a perguntas).
Glossário não-rígido:
- Aprendizaje por refuerzo: incorporar en un algoritmo la maximización de alguna «recompensa» expresada como función objetivo
- Classificação semi-supervisionada: algoritmo de classificação cujo treinamento utiliza alguns itens não rotulados, e muitos rotulados.
- Regra de associação: padrão de associação entre certos valores de atributo - por exemplo, detectar que certos valores ocorrem ao mesmo tempo.
- Sistema recomendado: algoritmo que sugere uma próxima opção ou decisão, tentando prever a classificação dessa opção ou decisão.
- Análise dos sentimentos: polaridade (positiva ou negativa) de uma expressão em linguagem natural, com respeito a um quadro de referência.
- Extração tópica: em um texto em linguagem natural, identificar o(s) tópico(s) abordado(s), com um grau de certeza.
- Análise de séries temporais: técnicas de mineração de dados orientadas para localizar padrões e elaborar modelos preditivos sobre dados que apresentam características de periodicidade.
- Clustering: identificação dos melhores grupos segundo os quais um conjunto de dados pode ser classificado.
- Discurso ao texto: a partir do sinal de áudio da voz, transcreva o texto que ela representa.
- Resposta a perguntas: sistema ideal capaz de compreender e responder, em linguagem natural, perguntas sobre uma determinada área temática.
Fernando López Bello @fer_lopezbello
Engenheiro de computação, PMP
Grande especialista em dados
*Este artigo faz parte do Blog Quanam: mais informações
Conecta