como gerar 20 terabytes de dados por dia?
aliás, por noite… e como administrar tal montanha de informação?… um terabyte é um milhão de megabytes, 1.000.000 mega. pra quem não é de informática ou ciências, um mega é um milhão; ou seja, estamos olhando para uma quantia que tem 12 zeros, o famoso e quase ininteligÃvel trilhão. costumava-se dizer, no passado [uns dez anos atrás] que a encyclopaedia britannica tinha cerca de um gigabyte [um bilhão de caracteres, contando as imagens]… e era mais ou menos verdade, porque uma versão da coisa cabia num cd [onde se pode comprimir aà por um giga mesmo].
20 terabytes, já que um tera é 1.000 giga, é o equivalente a 20.000 britannicas, e esta montanha de dados vai ser gerada por noite, pelo lsst, large synoptic survey telescope, um istrumento de 8.4 metros que será localizado no norte do chile [cerro pachón], e que vai começar a operar em 2012 com uma câmera de três giga [bilhões!] pixels, uma resolução mil vezes maior do que a câmera digital média que está no mercado hoje.
vamos saber muito mais sobre o universo quando este telescópio começar a funcionar. mas vamos, para tal, ter que aprender a tratar quantidades realmente astronômicas de dados. um dos maiores projetos de astronomia do mundo, o sdss [sloan digital sky survey], cujos resultados você pode ver no skyserver, mostra “apenas” um lote de 12 terabytes de dados… 60% do que o lsst vai gerar por noite. os problemas e oportunidades para realizar eScience [fusão dos modos teórico, experimental e computacional de fazer qualquer tipo de ciência, baseado em quantidades imensas de dados] serão motores muito importante do desenvolvimento das teorias e tecnologias de computação, comunicação e controle nas próximas décadas…
em breve, não haverá um “e” antes de eScience; informática simplesmente estará completamente imersa nas ciências todas, como leitura e escrita estão. e todas as ciências serão da computação…