<?xml version="1.0" encoding="ISO-8859-1"?><!-- generator="wordpress/1.5.2" -->
<rss version="2.0" 
	xmlns:content="http://purl.org/rss/1.0/modules/content/">
<channel>
	<title>Comments on: Mikä ihmeen robots.txt ?</title>
	<link>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html</link>
	<description>Asiantuntevia neuvoja ja vihjeitä kotisivujen hakukoneoptimointiin</description>
	<pubDate>Mon, 21 Jul 2008 01:23:26 +0000</pubDate>
	<generator>http://wordpress.org/?v=1.5.2</generator>

	<item>
 		<title>Comment on Mikä ihmeen robots.txt ? by: Hakukoneoptimointia</title>
		<link>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1596</link>
		<pubDate>Thu, 15 Mar 2007 12:40:39 +0000</pubDate>
		<guid>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1596</guid>
					<description>Juu, noin se toimii.</description>
		<content:encoded><![CDATA[	<p>Juu, noin se toimii.
</p>
]]></content:encoded>
				</item>
	<item>
 		<title>Comment on Mikä ihmeen robots.txt ? by: d</title>
		<link>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1595</link>
		<pubDate>Wed, 14 Mar 2007 20:38:55 +0000</pubDate>
		<guid>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1595</guid>
					<description>Kiitoksia vinkeistä.

Kysyn vielä: jos ihan simppelisti haluaa estää tietyn sivun indeksoitumisen, pitäisi se sitten varmaankin panna robots.txt tiedostoon kahdesti?

Disallow: /index.php?id=1&amp;#38;id=2
Disallow: /?id=1&amp;#38;id=2

Sivustolle on mahdollista päätyä urlin kautta jossa index.php. Toisaalta serveripalvelu on sen verran alkeellinen ettei pääse ihan mitä tahansa muuttelemaan .htaccessiin.</description>
		<content:encoded><![CDATA[	<p>Kiitoksia vinkeistä.</p>
	<p>Kysyn vielä: jos ihan simppelisti haluaa estää tietyn sivun indeksoitumisen, pitäisi se sitten varmaankin panna robots.txt tiedostoon kahdesti?</p>
	<p>Disallow: /index.php?id=1&amp;id=2<br />
Disallow: /?id=1&amp;id=2</p>
	<p>Sivustolle on mahdollista päätyä urlin kautta jossa index.php. Toisaalta serveripalvelu on sen verran alkeellinen ettei pääse ihan mitä tahansa muuttelemaan .htaccessiin.
</p>
]]></content:encoded>
				</item>
	<item>
 		<title>Comment on Mikä ihmeen robots.txt ? by: Hakukoneoptimointia</title>
		<link>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1594</link>
		<pubDate>Wed, 14 Mar 2007 19:18:59 +0000</pubDate>
		<guid>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1594</guid>
					<description>Kummankin kyllä pitäisi toimia.

Tuo onkin hieman kinkkisempi homma. Oletan siis, että haluat robottien vierailevan vain /? -osoitteissa.

Voisit kokeilla tätä:

Disallow: /index.php?
Allow: /?

Tässä tapauksessa sivuston linkkien täytyy tosiaan osoittaa /?id=1&amp;#38;id=2 jne. Muuten robotti vain häipyy sivuilta jos linkit eivät ole kunnossa. Järkevämpää tosin olisi ohjata vaikka .htaccessilla kaikki käyttäjät automaattisesti /? -osoitteisiin index.php? -osoitteista.

Lisää sivustosi tänne, niin saat hyvää detaljia hakurobottien liikkeistä sivuillasi ja siitä onnistuuko/estetäänkö indeksointi. Tuolta voit myös tarkastaa robots.txt:n toimivuuden:

http://www.google.com/webmasters/</description>
		<content:encoded><![CDATA[	<p>Kummankin kyllä pitäisi toimia.</p>
	<p>Tuo onkin hieman kinkkisempi homma. Oletan siis, että haluat robottien vierailevan vain /? -osoitteissa.</p>
	<p>Voisit kokeilla tätä:</p>
	<p>Disallow: /index.php?<br />
Allow: /?</p>
	<p>Tässä tapauksessa sivuston linkkien täytyy tosiaan osoittaa /?id=1&amp;id=2 jne. Muuten robotti vain häipyy sivuilta jos linkit eivät ole kunnossa. Järkevämpää tosin olisi ohjata vaikka .htaccessilla kaikki käyttäjät automaattisesti /? -osoitteisiin index.php? -osoitteista.</p>
	<p>Lisää sivustosi tänne, niin saat hyvää detaljia hakurobottien liikkeistä sivuillasi ja siitä onnistuuko/estetäänkö indeksointi. Tuolta voit myös tarkastaa robots.txt:n toimivuuden:</p>
	<p><a href='http://www.google.com/webmasters/' rel='nofollow'>http://www.google.com/webmasters/</a>
</p>
]]></content:encoded>
				</item>
	<item>
 		<title>Comment on Mikä ihmeen robots.txt ? by: d</title>
		<link>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1593</link>
		<pubDate>Wed, 14 Mar 2007 18:44:05 +0000</pubDate>
		<guid>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1593</guid>
					<description>Onko tällä erolla merkitystä? Netin eri tutorialeissa on molemmanlaisia esimerkkejä.

Disallow: /sivu.html
Disallow: sivu.html

Jompikumpi oikein tai väärin?


Entäpä kuinka blokataan index.php?id1&amp;#38;id=2, kun linkkeihin ei ole määritetty sivua index.php (eli käytännössä vierailija voi olla sivulla domain.com/index.php?id1&amp;#38;id=2 tai domain.com/?id1&amp;#38;id=2)?</description>
		<content:encoded><![CDATA[	<p>Onko tällä erolla merkitystä? Netin eri tutorialeissa on molemmanlaisia esimerkkejä.</p>
	<p>Disallow: /sivu.html<br />
Disallow: sivu.html</p>
	<p>Jompikumpi oikein tai väärin?</p>
	<p>Entäpä kuinka blokataan index.php?id1&amp;id=2, kun linkkeihin ei ole määritetty sivua index.php (eli käytännössä vierailija voi olla sivulla domain.com/index.php?id1&amp;id=2 tai domain.com/?id1&amp;id=2)?
</p>
]]></content:encoded>
				</item>
	<item>
 		<title>Comment on Mikä ihmeen robots.txt ? by: Hakukoneoptimointia</title>
		<link>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1585</link>
		<pubDate>Sun, 11 Mar 2007 17:06:01 +0000</pubDate>
		<guid>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1585</guid>
					<description>Juu</description>
		<content:encoded><![CDATA[	<p>Juu
</p>
]]></content:encoded>
				</item>
	<item>
 		<title>Comment on Mikä ihmeen robots.txt ? by: Kode</title>
		<link>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1584</link>
		<pubDate>Sun, 11 Mar 2007 14:39:00 +0000</pubDate>
		<guid>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1584</guid>
					<description>Blokataanko alikansion alikonsio näin

Disallow: /alikansio1/alikansio2/

Eli alikansio1 indeksoidaan ja alikansio2 blokataan tällä tavalla?</description>
		<content:encoded><![CDATA[	<p>Blokataanko alikansion alikonsio näin</p>
	<p>Disallow: /alikansio1/alikansio2/</p>
	<p>Eli alikansio1 indeksoidaan ja alikansio2 blokataan tällä tavalla?
</p>
]]></content:encoded>
				</item>
	<item>
 		<title>Comment on Mikä ihmeen robots.txt ? by: Hakukoneoptimointia</title>
		<link>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1578</link>
		<pubDate>Fri, 09 Mar 2007 07:45:46 +0000</pubDate>
		<guid>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1578</guid>
					<description>Disallow: index.php?action=profile&amp;#38;id=*

Tuo ei tosin ole standardin mukainen, mutta muistaakseni ainakin Yahoo ja Google tukevat &quot;wildcard&quot; -merkkiä.</description>
		<content:encoded><![CDATA[	<p>Disallow: index.php?action=profile&amp;id=*</p>
	<p>Tuo ei tosin ole standardin mukainen, mutta muistaakseni ainakin Yahoo ja Google tukevat &#8220;wildcard&#8221; -merkkiä.
</p>
]]></content:encoded>
				</item>
	<item>
 		<title>Comment on Mikä ihmeen robots.txt ? by: Ã…oke</title>
		<link>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1570</link>
		<pubDate>Tue, 06 Mar 2007 08:56:54 +0000</pubDate>
		<guid>http://www.hakukoneoptimointia.com/hakukoneoptimointi/mika-ihmeen-robotstxt.html#comment-1570</guid>
					<description>Miten blokataan tälläinen domain.com/index.php?action=profile&amp;#38;id=32 jossa id on vaihtuva ja niitä on kymmeniä?</description>
		<content:encoded><![CDATA[	<p>Miten blokataan tälläinen domain.com/index.php?action=profile&amp;id=32 jossa id on vaihtuva ja niitä on kymmeniä?
</p>
]]></content:encoded>
				</item>
</channel>
</rss>
