Psicofonías

(algo así como el blog de Psicobyte)

Google.cn (pero mejor)

Escolar dice en este post que yo explico en este otro algo que, en realidad, no he explicado. Y como me siento mal por no cumplir esas espectativas, voy a tratar de hacerlo y de camino, aportar algo más decente a este tema.

Pero, si no te importa, empezaré por el principio.

Los chinos tienen un gobierno que antes era muy malo, porque era una tiranía comunista que no permitía los mínimos derechos fundamentales.

Ese mismo gobierno ahora se está abriendo al libre mercado, por lo que ya no es tan malo. Aunque, de todos modos, sigue pasándose por el arco del triunfo los derechos de sus habitantes.

Y una de las cosas que no le gusta a ese gobierno es que sus ciudadanos navegen por cualquier página de internet, porque pueden encontrarse con cosas que no deben.

Así que el gobierno chino le pidió a google que filtrase los resultados de sus búsquedas en China, para preteger a sus inocentes ciudadanos de los peligros de internet.

Y google lo hizo.

Ahora ahda el bloguerío intentando averiguar qué es lo que los chinos puden ver en google y qué es lo que no.

Para ello, lo necesario sería entrar en google.cn (el servidor de google para China) pero, si lo intentas, verás que te redirige automáticamente a google.com.

Esto es porque tu navegador agrega a sus peticiones web inforación de dónde estás y todo eso, y google asume que tú vas a querer buscar en el buscador que considera más adecuado, que para tí resulta no ser el de China.

De modo que hay que engañar a google, para que crea que tú "necesitas" de verdad el buscador chino.

Un método es decirle que tu idioma es el chino. para ello hay un parámetro en la URL (hl=zh-CN) que especifica que hablas chino.

Pero los navegadores mandan información de muchos modos. Pese a que a mí (con firefox) me ha funcionado simplemente cambiar el parámetro hl, parece que hay gente a la que no le funciona.

Por ello, he hecho un pequeño script para comparar más cómodamente los resultados de google.com y google.cn.

Lo que hace es, simplemente, mostrar una pantalla divida en dos horizontalmente: Arriba se muestran los resultados para google.com y abajo los resultados para google.cn

Los resultados de Google.com se muestran directamente, con lo que todas las cockies que tengas y esas cosas te aparecerán normalmente, y la página será perfectamente funcional.

Los resultados para google.cn, sin embargo, son distintos.

Para evitar que cualquier información de tu navegador afecte a la búsqueda, lo que hace el script es solicitar él mismo la página, tomar el resultado, y mandarselo a tu navegador.

Eso significa que la configuración de tu ordenador o tu navegador no interfiere en la búsqueda, pero también significa que algunos enlaces de la página resultante no son funcionales (aunque puedes meter un texto directamente y buscarlo, y pasar páginas, por ejemplo). He programado el script en un momentillo, y me he metido a parsear solo lo más importante...

Si google.cn filtra por IPs o algo por el estilo, todo este script no sirve de nada. Por otro lado, si los resultados que muestra esta página son correctos (y, hasta ahora, todo el mundo parece tomarlos por correctos), los de este script también deben serlo, porque dan los mismos resultados.

Hala, ahí queda eso...

Otros post en este blog que hacen alusión a este:
(17995 visitas a este artículo)
PCMS 2004