revolução: busca em vídeo
o MIT acaba de tornar pública uma nova tecnologia que permite pesquisa textual em vídeos [de aulas, por exemplo]. claro que isso já era possível quando um operador humano transcrevia as falas e sincronizava o texto correspondente com o vídeo. sobre o resultado textual, fazia-se uma busca que, por sua vez, apontava para o vídeo.
a promessa da inovação é de transcrição automática do áudio [isolado ou no vídeo] e correspondente busca no texto e ligação, de volta, com o áudio e/ou vídeo. pode parecer pouco mas pode ser, também, uma revolução.
em primeiro lugar, um número cada vez maior de universidades e escolas começa a tornar disponíveis, on line, aulas, seminários e conferências. na maioria das vezes, não estamos interessados em ouvir 45 minutos de conversa mole só pra achar os 5 ou 10 minutos que interessam. revisar aulas ou encontrar partes importantes de palestras pode ficar muito simples.
por outro lado, banda larga na rede, por toda parte, vai transformar video-on-demand em uma realidade mais próxima de todos nós. procurar gols nos jogos, palavras-chave nos noticiários, cenas nos filmes e documentários vai ficar muito mais fácil. vamos "assistir" as coisas "aos pedaços". e vai ser muito simples. e vai bagunçar, ainda mais, qualquer noção corrente que se tem de "audiência".
o problema é que a precisão do reconhecimento de fala de personagens não treinados é somente da ordem de 50%. palavras-chave mais comuns ainda são reconhecidas, mas perde-se a riqueza maior do processo.
na próxima rodada de melhorias, pode rolar um analisador semântico de sentenças, capaz de extrair conceitos abstratos da fala dos personagens e resolver, a partir daí, perguntas muito mais sofisticadas do que fazemos aos engenhos de busca de hoje. é esperar pra usar.
December 3rd, 2007 at 4:02 pm
Muito interesante,
Hoje vejo o video como uma ferramenta educativa, por demais sub-utilizada.
Acredito que ele ganhará bem mais autonomia, do que apenas o registro. A linguagem multimidia, permitira a aproximação tão buscada na internet. No caso do vídeo, com mais emoção.
Queria deixar uma reflexão, será que a internet 2.0 terá o video dentro de si, ou o vídeo com a internet em si, será a versão 2.0 ou talvez 3.0?
December 3rd, 2007 at 5:32 pm
Pô, fenomenal!
Vamos supor entao que as pessoas que exercitam atividades que utilizem recursos de oratória terão uma possivel “reciclagem” para “como falar adequadamente para ser entendido nos sistemas de busca”.
Imaginemos entao o jornal nacional utilizando tags mais buscadas!
“Boa noite, sexo, carros, futebol, cerveja….” Depois a notícia!
KKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKKK