25.09.07
Publicado en Posicionamiento SEO, Recursos SEO a las 18:47 by admin
En este recurso no voy hablar de los elementos que forman parte en una URL sino de la forma cómo deben construirse en un proyecto así favorecer el posterior posicionamiento en buscadores y el registro de datos en los sistemas de analítica web.
En mi experiencia en el desarrollo de páginas web me he encontrado con dos focos bien diferenciados de proyectos web. Por un lado encontramos:
- Páginas nuevas, más fáciles de definir ya que todavía no se encuentran en Internet y no debemos tener en cuenta las visitas y enlaces que recibe cada URL.
- Páginas online, estas llevan su tiempo en la red y debemos rehacerla por completo o rehacer su estructura añadiendo un nuevo módulo, por ejemplo, un comercio electrónico.
En el primer caso no es necesaria mucha dedicación en definir cómo deben ser estas URL para que sean atractivas a los buscadores, pero en el segundo caso, el tiempo de análisis, estudio y pruebas pueden llegar a incrementar estas horas entre un 50% y 75% con relación a un sitio nuevo.
Estas horas se destinan básicamente en decidir qué cambios son los más apropiados para que no afecten al rendimiento que está generando la web y qué expresiones regulares deberán prepararse para que el archivo .htaccess de nuestro servidor interprete los cambios.
¿Qué debemos hacer?
A partir de ahora nos centraremos en los detalles técnicos sobre sitio online.
Estoy suelen presentar URL dinámicas, ejemplo: netdebugger.com/index.php?action=5, que afectan a la integridad de los buscadores ya que pueden entrar en ciclos indefinidos. Por ejemplo, un calendario de eventos encontraría un número infinito de años, y el buscador al seguir todos enlaces encontraría ciclos y más ciclos hasta llegar a provocar restricciones de tiempo servidor “time out”.
El archivo .htaccess no es más que el archivo de configuración de nuestra página web habituales en servidores Apache. Proporciona características técnicas a los exploradores de los usuarios y a las arañas de los buscadores para que puedan llegar a directorios y contenidos del sitio. Por otro lado dispone del módulo mod_rewrite que es el encargado de traducir una URL estática para mostrar el contenido correspondiente a la URL dinámica, esta traducción la conseguimos a través de la expresiones regulares que insertemos en el archivo .htaccess.
Después de esta breve referencia sobre los distintos recursos técnicos disponibles, es necesario tener claro qué formato vamos a dar a las URL estáticas, en mi experiencia recomiendo seguir esta línea para un sitio multiidioma con 2 niveles de profundidad.
Caso práctico formato de las URL:
Página principal: (raíz idioma) /
Ej.: netdebugger.com/spa/
1er nivel: sección / (idioma) /
Ej.: netdebugger.com/investigaciones-seo/spa/
2º nivel: subsección / sección / (idioma) /
Ej.: netdebugger.com/casos/investigaciones-seo/spa/
Contenido: título / sección / subsección / (idioma) /
Ej.: netdebugger.com/contenido/investigaciones-seo/casos/spa/
Referencias:
Raíz idioma = página principal del sitio según el idioma
Idioma = idioma del contenido
Sección = investigaciones-seo
Subsección = casos
Título = contenido “corresponde al título del documento”
Esta recomendación también podría aplicarse para los blogs pero antes lee las recomendaciones de Matt Cutts que encontrarás en esta presentación Power Point. Debes distinguir que un blog es un espacio para compartir conocimiento o comentarios entre los bloggers y un proyecto web es más un espacio comercial de productos y servicios.
Permalink
13.09.07
Publicado en Recursos SEO a las 22:04 by admin
Desde el 18 de Junio vengo siguiendo los pasos de una nueva funcionalidad en las búsquedas avanzadas de Google y anunció MattCutts en su blog como una solución para los webmasters para conocer la frescura de los contenidos.
En esa fecha sólo podíamos filtrar los resultados según si el contenido había sido indexado en cualquier momento, los últimos 3 o 6 meses y a lo largo de el último año.
El 30 de Agosto, antes de irme de vacaciones estuve indagando de nuevo en esta funcionalidad y pude ver que se añadieron nuevos períodos que permitían filtrar los contenidos según intervalos más cortos desde las últimas 24 horas, última semana, 1 mes o 2 meses.
Finalmente ayer día 12 de Septiembre MattCutts volvió a recordar esta funcionalidad dándole como título “fechas de las mejores búsquedas” informando de nuevo de la funcionalidad que llevo tiempo utilizando con algunos proyectos, el análisis de las páginas indexadas de un dominio en los últimos días/semanas/meses/años.
En la actualidad no considero que sea un recurso muy útil para un usuario que sólo necesita encontrar una información concreta pero sí para un usuario más avanzado que desea profundizar la búsqueda o en lo que defino como “investigación SEO”.
¿Cómo funciona?
Básicamente y de forma fácil puedes hacer uso de este filtro accediendo al enlace “Búsquedas avanzadas” de Google y seleccionas el período en el selector que encontrarás junto a “fechas Mostrar las páginas web vistas por primera vez en”.
Pero si lo prefieres, también puedes modificar la URI de la búsqueda en Google añadiendo este parámetro “&as_qdr=m2”.
Para recordar más fácilmente las iniciales “as_qdr” MattCutts aporta una sencilla pero eficaz sugerencia, nos dice que pensemos en “advanced search — query date range”
¿Qué finalidad tiene?
En el caso relacionado con mis investigaciones, hago uso de esta funcionalidad para conocer de antemano cómo evolucionan los cambios que se realizan en los sitios y los contenidos web, analizar los resultados que se obtienen e incluso el grado de rapidez que tiene Google en indexar las páginas.
Al fin y al cabo, permite estudiar con más detalle el comportamiento en cuanto a la cantidad de páginas indexadas y la posición de cada una según la búsqueda de una palabra clave su “relevancia”.
Debemos recordar que:
- un contenido “página” obtiene una posición los primeres meses de ser indexado,
- Google muestra resultados según buscamos una palabra clave,
- existen palabras clave más populares que generan visitas y ventas,
- si perdemos ranking será porqué no nos encontramos entre los primeros puestos,
- a medida que pasa el tiempo, si no efectuamos cambios el contenido se vuelve antiguo.
- un contenido antiguo pierde peso para la búsqueda de la misma palabra clave.
En resumen, Google es una sofisticada tecnología de ingeniería automática que accede a un contenido y volverá hacerlo otras veces para comprobar si ha sido modificado. De esta manera, además de tener los contenidos al día, el buscador puede determinar la fecha en la que se realizó la última actualización.
Contra menos tiempo hace de la última modificación detectada en un documento mayor es la posición que podemos obtener en los resultados.
La red es viva y para ello es necesario ser dinámico, aportar información a nuestros usuarios, actualizar contenidos o el propio diseño.
Permalink
07.09.07
Publicado en Recursos SEO a las 17:55 by admin
La posibilidad de desarrollar un sitio siguiendo los estándares establecidos por el consorcio W3C nos permite internacionalizar nuestro contenido asegurando que los formatos y protocolos puedan ser utilizados de forma universal en todos los idiomas y sistemas de escritura.
Para ello es fundamental que en el código no visible de nuestra página web “código fuente” se incluya el charset apropiado, en este caso sugiero utilizar el UTF-8.
meta http-equiv="Content-Type" content="text/html;charset=utf-8"
El uso de UTF-8 es un tipo de codificación de caracteres para Unicode que nos permite escribir nuestras páginas web y no preocuparnos por si se va a ver correctamente o van a aparecer caracteres extraños a la página que encuentre nuestro usuario.
En todos los proyectos de múltiples idiomas sugiero trabajarlos con la codificación UTF-8, a excepción del Japonés y Coreano que sería preferible utilizar el UTF-16 al ocupar menos espacio y ser más flexible a la hora de presentar los caracteres.
En la web del consorcio W3C podemos encontrar todas las posibilidades disponibles según el lenguaje pero también nos recomienda el uso del UTF-8 siempre que sea posible. Por este motivo me he acostumbrado a realizar siempre los proyectos en esta codificación y así evitar problemas en futuras actualizaciones del sitio o en los tests que al final me llevan a la misma conclusión.
Es necesario que cada parte del proyecto use la codificación UTF-8, no vale únicamente con escribir la páginas HTML en UTF-8, porque, por ejemplo, si obtenemos los datos de una base de datos que contiene otra codificación puede ocasionarnos problemas a la hora de ser mostrados.
Recursos SEO:
Si queremos estar seguros que esta codificación es la correcta, podemos comprobarlo como lo utilizan sitios internacionales involucrados en lo que refiere al posicionamiento y buscadores:
http://www.mattcutts.com/blog/
http://www.google.com
http://www.yahoo.com/
http://www.msn.com/
http://www.w3.org/
(…)
Además en esta página podemos comprobar cómo veríamos el texto o caracteres que soporta la codificación UTF-8:
Si eres técnico, te recomiendo que añadas la página de soporte técnico y publicaciones de W3C en tus favoritos para seguir las últimas actualizaciones y recomendaciones establecidas para seguir los estándares de Internet.
Permalink