P2P mais rápido com partilha de ficheiros semelhantes Publicado 12 Abr 07
Protocolos de P2P como o BitTorrent conseguem localizar rapidamente os pares que têm uma cópia exacta do ficheiro que queremos transferir. Mas e se for possível não só identificar ficheiros idênticos, mas também semelhantes ao pretendido? O resultado poderá muito bem ser um aumento significativo da velocidade dos downloads, afirmam uma equipa de investigadores das Universidades de Carnegie Mellon e Purdue e da Intel. Os criadores do Similarity-Enhanced Transfer (SET) sustentam que esta nova técnica que foi ontem apresentada no Quarto Simpósio de Design e Implementação de Sistemas de Rede, em Cambridge, Massachusetts (EUA) pode acelerar as transferências de ficheiros via P2P entre 30 a 70 por cento.
Isto porque a identificação de dados idênticos em muitos ficheiros partilhados online permite aumentar os pares ou fontes potenciais para os downloads. No caso do BitTorrent, por exemplo, o tempo de espera para que a transferência termine pode ser excessivo se o sistema não encontrar um número suficiente de fontes para usar toda a largura de banda disponível para download do utilizador. Indo mais além, o SET tira partido do facto de muitos ficheiros de música apenas diferirem nas tags de identificação, que vídeos dos mesmos filmes apenas diferem no facto de estarem dobrados ou legendados em línguas diferentes e de existirem várias versões de um software compostas por partes comuns.
Um dos exemplos que os investigadores adiantam para demonstrar o mecanismo de funcionamento do SET consiste num utilizador localizado nos EUA que pretende fazer o download de uma versão em alemão de um filme bastante popular. Enquanto que os sistemas actuais iriam provavelmente efectuar o download de maior parte do ficheiro a partir de pares localizados na Alemanha, o SET poderá permitir que o utilizador obtenha a maioria dos dados relativos ao vídeo a partir de ficheiros de versões inglesas disponíveis nos discos rígidos de internautas norte-americanos e transferir apenas a componente áudio de utilizadores em solo alemão.
Da mesma forma que o BitTorrent, o SET divide grandes ficheiros em pequenos segmentos únicos; um ficheiro de um gigabyte é assim dividido em 64 mil blocos de 16 Kbytes. Mas para encontrar ficheiros semelhantes o SET recorre a um método chamado handprinting (”impressão manual”), parecido com as técnicos de reconhecimento de padrões empregues para encontrar resultados de pesquisa ou filtrar lixo electrónico (spam). A partir daí, os blocos individuais dos ficheiros semelhantes são inspeccionados de forma a descobrir aqueles que são idênticos ao ficheiro que está a ser transferido. Por fim, todos esses blocos são reagrupados num ficheiro único.
Nos testes realizados e que se basearam em ficheiros obtidos das redes P2P actuais, o SET conseguiu carregar um trailer de um filme com o tamanho de 55 Mbytes a uma velocidade 30 por cento mais rápida, dado que o software foi capaz de encontrar outras fontes com uma semelhança de 50 por cento. Do mesmo modo, a taxa de transferência de um MP3 aumentou em 70 por cento.
O método de handprinting parece empregar o mesmo tipo de técnica de Distributed Hash Table que muitos clientes de BitTorrent utilizam para efectuar uma comparação entre blocos. Só que aqui a comparação é feito ao nível dos próprios ficheiros. Mas será que esta técnica não poderá tornar os ficheiros mais vulneráveis a blocos corrompidos? Talvez seja necessário esperar para ver na prática se o algoritmo é suficientemente sofisticado para identificar correctamente os blocos sãos.
Outra questão que se coloca é a de saber se o SET funciona também com ficheiros que apesar de serem bastante semelhantes em termos visuais apresentam binários muito diferentes, devido a estarem codificados com resoluções/codecs de vídeo ou bit rate de áudio bastante diversos. Talvez isso não seja por enquanto possível, mas no artigo apresentado os autores adiantam que em relação a músicas com metadados diferentes (nome do artista e da faixa diferentes) os ficheiros MP3 identificados eram 99 por cento semelhantes e que nos casos de vídeos em duas línguas diferentes, os ficheiros apresentavam uma semelhança de 15 a 30 por cento.
Artigos relacionados:
- Songbeat - um programa para descarregar músicas grátis do Seeqpod
- Números que dão a volta ao direito de autor
- Nova versão do uTorrent resolve falha de segurança adicional
- Como enganar os filtros que impedem o download de torrents
- Descobre se o teu ISP bloqueia o tráfego de BitTorrent






Bom artigo, parabéns
Comentário de SkySkull em 12 Abr 07 20:35.Obrigado
Comentário de Miguel Caetano em 12 Abr 07 20:52.