Archive for the 'information agents' Category

infosfera: somos todos parte dela

Tuesday, November 7th, 2006

O mundo está ficando mais complexo e mais rápido. Informação, cada vez mais, é parte essencial de nossas vidas. Inclusive para voar… esta é a abertura de meu artigo de hoje no g1.globo.com.

o “ciberespaço” vai à guerra.

Monday, November 6th, 2006

ou a guerra vem pra internet. a força aérea americana mudou sua definição de missão, no fim do ano passado, para incluir como áreas operacionais, além do espaço e do ar, o “ciberespaço”. mês passado, o estado maior de lá, o U.S. Joint Chiefs of Staff definiu [e olha que isso pega!] o ciberespaço como “characterized by the use of electronics and the electromagnetic spectrum to store, modify, and exchange data via networked systems and associated physical infrastructures”, o que cobre muito mais do que a rede… pois envolve tirar do ar satélites e partes do espectro eletromagnético, inclusive. coisa de louco.

o air force cyberspace command vai ser pilotado, literalmente, por um tenente-general, o que é bastante alto na hierarquia e, segundo o secretário da força aérea, michael wynne“…war is data-dependent. We need to protect our data while detecting adversary data and then deny, disrupt, dissuade or destroy the source of that data or transmission as appropriate.” breve, numa máquina perto de você, uma águia nada amigável…

china parte pra nomes “reais” em blogs

Friday, November 3rd, 2006

a “internet society” da china, associada ao ministério da indústria da informação de lá, acaba de recomendar ao governo que adote um sistema de “nomes reais” [seu blog é seu blog e você tem que provar que você é você e o blog é seu… e arcar com todas as conseqüências disso!] para a autoria de informação na rede. um representante da sociedade disse à xinhua, a radiobrás de lá, que… “A real name system will be an unavoidable choice if China wants to standardize and develop its blog industry”.

padronizar, organizar, desenvolver, danem-se as liberdades individuais e garantias constitucionais. o governo chinês acha que ninguém precisa delas. pelo menos é claro sobre isso, ao contrário de países onde as garantias existem mas são violadas a cada minuto e, aos culpados óbvios, nada acontece. deve ser um inferno -como diria ancelmo góis- viver em países onde tal tipo de violência é comum…

algo a menos no ar… aviões de carreira

Tuesday, October 31st, 2006

quando do desastre da gol, escrevi no G1 que “aviões não saem por aí, no espaço, como bem entendem“… a prova cabal disso é que os controladores de vôo resolveram, agora, trabalhar dentro regras de proteção ao vôo, dentro dos limites operacionais e humanos a que estão sujeitos…

donde se depreende que, antes, eles estavam fora das regras. o resultado é que o tráfego aéreo máximo que pode ser tocado pelo que existe de infra-estrutura de controle no país está levando o caos aos principais aeroportos do país. ou seja, os aviões não podem sair do chão enquanto a distância regulamentar entre eles não atingir o tempo em que o vôo é seguro.

talvez isso explique porque o ministério da defesa, no dia do acidente, foi tão rápido ao culpar pilotos e dizer que, no chão, tudo estava às mil maravilhas. não estava. e não está.

como os adolescentes sequestraram a internet [?}

Friday, October 20th, 2006

sam vaknin acaba de publicar um texto muito interessante em global politician, supostamente mostrando que o conjunto google-wikipedia-myspace-blogspot passou a dominar a internet porque, ele próprio, dominado por adolescentes. isso é que é protagonismo juvenil…

dr. vaknin acompanha 154 palavras e as respostas de google pra elas desde 1999. destas, 128 primeiros resultados são páginas da wikipedia, hoje, 38 dos quais são “stubs”, termo usado pela wikipedia para denotar artigos que ainda precisam ser realmente escritos. wikipedia recebe 54% de seu tráfego vindo de google; depois de chegar lá, a maioria dos visitantes vai para myspace e blogspot, cujo engenho de busca é… google. de onde eles supostamente voltam para a wikipedia, fechando o ciclo.

ou seja, um número muito grande de usuários da internet [se o estudo for confirmado independentemente] está vivendo fechado em quatro grandes repositórios de informação, o estaria sendo estimulado pelo algoritmo atual de google, que promove a wikipedia -talvez sem razão em um número muito grande de casos, a confiarmos no dr. vaknin- desmesuradamente.

como validar os resultados? teste “love” em google e em search.msn.com: no primeiro, a wikipedia é a terceira resposta e, no segundo… é a primeira! a primeira -e muito esquisita- resposta de google é um certo love calculator… que determina a probabilidade de um relacionamento de sucesso entre “qualquer” duas pessoas… baseado nos seus nomes, uma resposta claramente construída para adolescentes e, segundo a qual, a chance de eu estar com katia é… zero. estamos juntos desde 1997. ainda bem que o “serviço” não existia, então…

terra de gigantes: microsoft aumenta a aposta

Thursday, October 19th, 2006

depois de dizer publicamente que google está tornando difícil, para a microsoft, o recrutamento de talento de primeira linha, steve ballmer anuncia que a empresa de redmond vai aumentar sua aposta em pesquisa e desenvolvimento, dos US$6.2 bilhões de dólares de 2005/6 [julho a junho] para US$7.5 bilhões [R$17 bilhões] em 2006/7, um crescimento de quase um quarto. para se ter uma idéia do tamanho do esforço de P&D da empresa, se os recursos prometidos para o fundo nacional de desenvolvimento científico e tecnológico [fndct] do governo federal para 2006 forem efetivamente liberados e gastos com P&D, a república investirá R$1.2 bilhões de reais, perto de meio bilhão de dólares -ou quinze vezes menos do que os fabricantes de windows- em pesquisa e desenvolvimento.

é meio bilhão de dólares, mais ou menos, que a empresa vai gastar em P&D da europa; se tivéssemos gente em qualidade e quantidade, aqui [como na china e índia, sedes de laboratórios de pesquisa da microsoft], o brasil certamente poderia ser foco de investimentos de tal porte. somos uma das letras do grupo BRIC, afinal. mas o fato é que somente o I e o C receberam investimentos… e o B e o R? segundo ballmer, metade do pessoal que foi contratado para trabalhar na microsoft research recentemente veio de fora dos eua, incluindo cerca de mil russos. mais não falou, tampouco do brasil. ou estamos muito contentes por aqui, ou o salário da microsoft é baixo, ou não temos mil potenciais contratáveis pela microsoft research. a empresa, no brasil, está contratando engenheiros de software para outubro de 2007, pois não há mais vistos de trabalho [em tecnoloiga] para os eua… até o meio do ano que vem. os 20 mil vistos de 2006/7 evaporaram em oito semanas

a mensagem, qual é? pesquisa e desenvolvimento não é para principiantes ou despossuídos. o jogo de software e/ou da internet é grande, pra gente grande… ou que pelo menos pense grande e tenha financiamento, mercado potencial e rede de contatos para chegar lá. e nós, faremos o que?…

como gerar 20 terabytes de dados por dia?

Sunday, October 15th, 2006

aliás, por noite… e como administrar tal montanha de informação?… um terabyte é um milhão de megabytes, 1.000.000 mega. pra quem não é de informática ou ciências, um mega é um milhão; ou seja, estamos olhando para uma quantia que tem 12 zeros, o famoso e quase ininteligível trilhão. costumava-se dizer, no passado [uns dez anos atrás] que a encyclopaedia britannica tinha cerca de um gigabyte [um bilhão de caracteres, contando as imagens]… e era mais ou menos verdade, porque uma versão da coisa cabia num cd [onde se pode comprimir aí por um giga mesmo].

20 terabytes, já que um tera é 1.000 giga, é o equivalente a 20.000 britannicas, e esta montanha de dados vai ser gerada por noite, pelo lsst, large synoptic survey telescope, um istrumento de 8.4 metros que será localizado no norte do chile [cerro pachón], e que vai começar a operar em 2012 com uma câmera de três giga [bilhões!] pixels, uma resolução mil vezes maior do que a câmera digital média que está no mercado hoje.

vamos saber muito mais sobre o universo quando este telescópio começar a funcionar. mas vamos, para tal, ter que aprender a tratar quantidades realmente astronômicas de dados. um dos maiores projetos de astronomia do mundo, o sdss [sloan digital sky survey], cujos resultados você pode ver no skyserver, mostra “apenas” um lote de 12 terabytes de dados… 60% do que o lsst vai gerar por noite. os problemas e oportunidades para realizar eScience [fusão dos modos teórico, experimental e computacional de fazer qualquer tipo de ciência, baseado em quantidades imensas de dados] serão motores muito importante do desenvolvimento das teorias e tecnologias de computação, comunicação e controle nas próximas décadas…

em breve, não haverá um “e” antes de eScience; informática simplesmente estará completamente imersa nas ciências todas, como leitura e escrita estão. e todas as ciências serão da computação…

[a]nother google killer would be?…

Sunday, October 8th, 2006

da homepage de powerset.com: Powerset is leading the next generation of internet search… Our unique innovations in search are rooted in breakthrough technologies that take advantage of the structure and nuances of natural language. Using these advanced techniques, Powerset is building a large-scale search engine that breaks the confines of keyword search. By making search more natural and intuitive, Powerset is fundamentally changing how we search the web, and delivering higher quality results… Powerset is a Silicon Valley startup currently operating in stealth mode. Please check back in the near future for more information about the company and its products. processamento inteligente, eficiente e eficaz de linguagem natural [incluindo a muito vaga e humana noção de “bom senso” que nós humanos {todos} achamos que temos] sempre foi um grande desafio. é exatamente o que o povo de powerset está atacando. só o futuro nos dirá se terão mesmo alguma chance no mercado… quem já viu acha que são competidores muito sérios. leia mais aqui.

greve: bangalore parada

Friday, October 6th, 2006

pela segunda vez em seis meses, a cidade de bangalore, na índia, onde os gigantes mundiais de [serviços de] software [ibm, eds, dell, hp, microsoft, infosys, wipro…] têm algumas de suas maiores bases, parou. em abril, foram dois dias de confusão por causa da morte do ator rajkumar, idolatrado na região e em toda a índia. desta vez, uma greve de doze horas fechou a cidade, onde existem mais de 1.500 empresas dedicadas ao negócio de outsourcing [desenvolvimento de software fora da empresa que vai utilizá-lo], deixando de cabelo em pé os centros internacionais que encomendam software na índia, como quase todo o mercado financeiro americano. a continuar assim, certamente haverá conseqüências para a competitividade indiana no setor.

difícil, aqui de fora, é entender as razões da greve: bangalore parou por causa de uma disputa de fronteiras de décadas entre karnakata, seu estado, e o vizinho maharashtra, algo como se, no brasil, pernambuco resolvesse reclamar de volta terras hoje na bahia, resultado de um redesenho na época da colônia. mas cada um sabe onde o sapato lhe aperta o pé. a confusão lá vem de antes da unificação da índia, passa pelo raj britânico e por um redesenho dos estados indianos em 1973. tomara que consigam resolver o imbroglio sem precisar ir às tapas.

enquanto isso, a ibm vai à luta e está diversificando ainda mais sua geografia: acaba de anunciar planos de contratar mais 15.000 funcionários para suas quatro subsidiárias nas filipinas, principalmente para os centros de atendimento [call centers] e execução de processos de negócios [bpo, ou business process outsourcing]. talvez valesse a pena perguntar porque muitos destes 15 mil não acabaram aqui, mas é melhor deixar pra depois das eleições [quando, provavelmente, também não iremos ter nenhuma resposta satisfatória]…

no ar: assimetria de informação

Saturday, September 30th, 2006

um avião da gol -fazendo o vôo 1907, 155 pessoas a bordo- se choca com um jato executivo em pleno ar, aparentemente em meio ao deserto verde da região de matupá, mato grosso. ninguém sabe direito o que aconteceu, mas o ministro da defesa faz questão de anunciar, quase imediatamente, que “deve ter sido um descuido da tripulação da gol“. como assim, camarada?…

aviões não saem por aí, no espaço aéreo, como querem e bem entendem: um conjunto de centros de controle de tráfego aéreo [em cada país] decide [e ordena] os caminhos por onde uma aeronave qualquer pode voar. as rotas aéreas são túneis virtuais, no espaço, dentro do quais os aviões “controlados” por tais sistemas [de informação, operados por e dependentes de seres humanos] são obrigados a manter uma distância regulamentar uns dos outros. assim, quando o leitor embarca de brasília a recife e o piloto diz que está voando na proa [direção] de bom jesus da lapa, ele o não faz porque quer, mas porque o túnel de brasilia a recife, naquela hora, para aquele vôo, passa por lá.

antes de dizer que “a tripulação da gol” deve ter feito alguma besteira, o senhor ministro deveria estar-se fazendo perguntas um pouco mais sensatas e complexas: 1] por que um jato executivo voava em rota de colisão com um avião comercial? 2] será que o controle de vôo botou os dois em tal situação [e aí o problema está na cozinha do ministro] ou 3] o controle de vôo nem sabia que o jato executivo estava lá [problemas na cozinha do ministro, de novo…] e… 4] não fez nada [ou não tinha condições de fazer] para tirá-lo de lá [olhaí as panelas do ministro no fogo de novo…].

não estou no negócio de defender a gol, mas é de uma leviandade sesquipedal um ministro de estado dar declarações sobre algo tão difícil de explicar antes mesmo de se ter respostas a perguntas tão básicas como as que qualquer passageiro freqüente [como eu] pode fazer sem ter um ministério da defesa inteiro para assessorá-lo. muito menos estou dizendo que o controle de vôo tem culpa no cartório; só questiono o diagnóstico -imediato- do senhor ministro sobre algo não trivial como o que acaba de acontecer.

o ecossistema de aviação de qualquer país é um sistema de informação; a qualquer momento, pode haver centenas de aviões no ar, transportando dezenas de milhares de vidas [veja o tamanho do problema, nos eua, aqui]. a segurança destas pessoas depende, ainda [enquanto um sistema anti-colisão, instalado em todos os aviões, não os torna conscientes da presença dos outros ao seu redor]. de um sistema de informação centralizado, cujo papel principal é garantir que toda e qualquer aeronave no seu espaço aéreo sabe porque está onde está, ao mesmo tempo em que assegura que um avião qualquer não vai, de uma hora pra outra, entrar no micro-espaço do outro. se isso acontecer, a chance de uma catástrofe é muito alta. e foi o que aconteceu com o gol 1907.

um dos casos recentes de colisão no ar, descoberta quase na hora pelo controle de tráfego aéreo e avisada aos pilotos, foi a que matou 59 pessoas quando um avião da DHL colidiu sobre o lake konstanz com um tupolev da bashkirian airlines: os dois pilotos mergulharam seus aviões para evitar o desastre e a igualdade das ações foi o fim de todos os passageiros e tripulantes. e o avião da DHL tinha o que de mais moderno havia em sistemas de alerta contra colisão, na época [como parece ser o caso do legacy e b737-800 envolvidos no acidente de ontem].

assumindo que nenhuma das duas tripulações envolvidas no acidente da gol estivesse deliberadamente tentando bater no outro avião, a responsabilidade do acidente está ligada à assimetria de informação entre os envolvidos: se os aviões e o controle responsável pela área soubessem, com a devida antecedência, do choque iminente, a comunicação entre as partes teria criado condições para que o desastre fosse evitado. uma coisa que o senhor ministro deveria estar começando a fazer, desde hoje à tarde, era garantir ao país que -seja lá o que tiver acontecido- haverá uma ampla investigação no sistema de informação [e controle] de tráfego aéreo, para dar certeza a todos os brasileiros que, ao entrarmos num avião, não estamos correndo os mesmos riscos do gol 1907, por culpa de responsabilidades do governo que deveriam funcionar a 100% de eficácia e eficiência, mas não estão assim tão bem das pernas.

tomara que não haja nada errado com o controle de vôo. mas, como o governo não tem toda esta tradição de investigar [seja lá o que for] a sério e profundamente -apesar de todas as declarações em contrário-, meu medo de avião aumentará muito neste domingo, quando terei que pegar logo três, para ir de recife a navegantes. que tudo dê certo, nem que seja por acaso… se não houver nenhum post aqui semana que vem, procurem o ministério da defesa para reclamar…

paraíba estatal digital: alta temperatura

Wednesday, September 27th, 2006

uma máquina da companhia de águas e esgotos do estado da paraíba está sendo responsabilizada por 1.200 tentativas de intrusão no ambiente de informática da prefeitura de joão pessoa. até aí, tudo bem; a máquina da cagepa pode ter sido invadida para ser usada como ponte para criar problemas na prefeitura. ocorre que a cagepa é estado, alçada do governador cássio cunha lima, do psdb e a prefeitura tem como alcaide ricardo coutinho, do psb, que declarou ao correio da paraíba: “Não aceitamos esse tipo de bandidagem. Queremos uma explicação plausível do governo do Estado, se é que é possível, e vamos marcar audiência com o ministro da Justiça para pedir providências. Isso fere o estado de direito e a autonomia das instituições”… vixe!

olhando de longe, é muito improvável que a cagepa esteja usando suas próprias instalações para invadir a prefeitura. se estiver, é muita incompetência [o que possivelmente teria aprendido com os tais “aloprados” de brasília]; muito mais provavelmente, as eleições estão com uma temperatura tão alta na paraíba que o prefeito vai levar um caso de hacking aparentemente básico ao ministro da justiça…

impressões REALMENTE digitais

Thursday, September 21st, 2006

você anda por aí, na internet, vendo isso e aquilo, clicando aqui e acolá, deixando seu rastro, sem saber [ou sem estar plenamente consciente] que, por onde você passa, há informação sendo recolhida sobre seu comportamento. pesquisadores de wharton e uc.davis acabam de publicar um artigo [completo, aqui, em pdf] defendendo a tese de que é possível, e bastante provável, identificar usuários individuais a partir de sua “assinatura”, ou seja, seu comportamento on-line, com uma alta margem de confiança no resultado. um artigo comentando o paper, para leigos, está aqui.

os autores do artigo, Padmanabhan & Yang, que trabalharam com o comportamento de 50.000 usuários, mostram que 13 sessões de uso da rede são o suficiente para identificar um usuário, neste lote, com 94.5% de certeza; para 51 sessões, a certeza é de 99.5% de que encontramos quem estávamos procurando. ou para quem estamos tentando inserir um anúncio na página ou emeio. no segundo caso, a operação pode ser “do bem” e o usuário pode até gostar; afinal, estamos aumentando a chance dele ver anúncios de coisas que realmente lhe interessam, apesar de estarmos destruindo sua chance de ver algo que não lhe era dirigido e do que iria gostar. ou seja, os resultados podem ser [e já estão sendo] usados para tirar parte do controle que ainda temos sobre nosso comportamento em rede.

no primeiro caso, há evidências de que estados policiais [que estão pipocando no planeta todo dia] gostariam muito de ter tal tipo de tecnologia à disposição, para controlar a vida de quem quer que seja. além do mais, o clickprint de usuários individuais é de interesse para todo mundo que quer nos identificar, de lojas a ladrões, passando por provedores e cartões de crédito. sabendo, do lado de cá, que eles estão preparados para isso, resta-nos tomar as providências para manter nossa privacidade sobre tanto sigilo quanto consigamos. resta saber se nossas ferramentas e preparo serão tão boas quanto as deles