Robots.txt
సైట్మ్యాప్లు మరియు నియమాలను కనుగొనడానికి మీ robots.txt ఫైల్ను Google అదే విధంగా చదివి అన్వయిస్తుంది. ఈ ఫలితాలు వ్యవస్థీకృత పట్టికలో ప్రదర్శించబడతాయి. మీరు ఏదైనా వెబ్సైట్ యొక్క Robots.txt ఫైల్ని కనుగొనవచ్చు.
Robots.txt ఫైల్ అంటే ఏమిటి?
Robots.txt అనేది శోధన ఇంజిన్ బాట్లకు URLల జాబితాను (యాక్సెస్ చేయనివి) కలిగి ఉన్న టెక్స్ట్ డాక్యుమెంట్ తప్ప మరొకటి కాదు. మీ వెబ్సైట్ ఏదైనా శోధన ఇంజిన్ ద్వారా సూచిక చేయబడినప్పుడు, శోధన ఇంజిన్లు సాలెపురుగులు ఈ పేజీల ద్వారా క్రాల్ చేస్తాయి. వారు తమ ఇండెక్స్ ఫైల్లను డేటాబేస్ అని పిలిచే నిర్దిష్ట డైరెక్టరీని కలిగి ఉంటారు. ఈ డేటాబేస్ క్రాల్ చేయబడిన వెబ్ పేజీల గురించి సమాచారాన్ని కలిగి ఉంది.
ఇప్పుడు మీరు శోధన ఇంజిన్ నుండి కొన్ని లింక్లను దాచాలనుకుంటే, మీరు ఈ Robots.txt ఫైల్ని సృష్టించాలి. మీరు ఈ ఫైల్ను మీ సైట్ యొక్క రూట్ ఫోల్డర్లో ఉంచాలి. కాబట్టి మీరు వాటిని Google శోధన ఫలితాల పేజీలో చూపకూడదనుకునే ఆ లింక్లను క్రాలర్ యాక్సెస్ చేయడానికి ప్రయత్నించినప్పుడు, అది Robots.txt ఫైల్ కోసం వెతుకుతుంది మరియు దాని కంటెంట్లను ప్రదర్శిస్తుంది. Robots.txt అనేది కేవలం మూడు పంక్తులు మాత్రమే వ్రాయబడిన సాధారణ టెక్స్ట్ ఫైల్.
రోబోట్స్ txt ఫైల్ దేనికి ఉపయోగించబడుతుంది?
రోబోట్స్ TXT ఫైల్ను సాధారణంగా రోబోట్ టెక్స్ట్ ఫైల్ ఫార్మాట్ అంటారు. ఈ రకమైన ఫైల్ను రూపొందించే ఏదైనా సాఫ్ట్వేర్ ప్రోగ్రామ్ను ఉపయోగించి ఈ రకమైన ఫైల్ను రూపొందించవచ్చు. రోబోట్స్ TXT ఫైల్ నిర్దిష్ట అంశానికి సంబంధించిన కీలక పదాల జాబితాను రూపొందించడానికి ఉపయోగించబడుతుంది. ఈ కీలకపదాలు తర్వాత Google మరియు ఇతర శోధన ఇంజిన్ల ద్వారా శోధించబడతాయి. చాలా వెబ్సైట్లు తమ వెబ్సైట్ కంటెంట్ను రూపొందించడానికి ఈ ఫైల్లను ఉపయోగిస్తాయని మీరు గమనించి ఉండవచ్చు.
రోబోట్స్ txt ఫైల్ అవసరమా?
- టెక్స్ట్ ఫైల్ను తరచుగా a.txt ఫైల్గా సూచిస్తారు ఎందుకంటే దానితో ముగుస్తుంది. అయితే, మీరు మీ కంప్యూటర్ ద్వారా వెళ్లి.txt పొడిగింపుపై క్లిక్ చేస్తే, నోట్ప్యాడ్++ వంటి సాఫ్ట్వేర్ని ఉపయోగించి మీరు ఈ ఫైల్ను వేరే ఫార్మాట్లోకి సులభంగా మార్చవచ్చు.
- Robots.txt ఫైల్లు శోధన ఇంజిన్లను మీరు ఇండెక్స్ చేయాలనుకుంటున్నారా లేదా ఇండెక్స్ చేయకూడదనుకుంటున్న కంటెంట్ని తెలుసుకోవడంలో సహాయపడటానికి ఉపయోగించబడతాయి. ఈ విధంగా, మీరు మీ వెబ్సైట్లో కనిపించకూడదనుకునే వెబ్ పేజీలను వారు ప్రదర్శించరు. Robots.txtని సమర్థవంతంగా ఉపయోగించడానికి, మీరు Google ఇండెక్సింగ్ నుండి మినహాయించాలనుకునే ఏదైనా పేజీ యొక్క రూట్ డైరెక్టరీలో దాన్ని చేర్చారని నిర్ధారించుకోవాలి. మీరు మీ సైట్లోని ప్రతి ఒక్క పేజీలోని హెడ్ సెక్షన్లో దానికి లింక్ను చేర్చవచ్చు లేదా రూట్ ఫోల్డర్లో ఉంచవచ్చు.
- మీ సైట్ని క్రాల్ చేయడంలో Googleకి సహాయపడటానికి robots.txt ఫైల్లు మంచివి అయితే, అవి ఖచ్చితంగా అవసరం లేదు. మీ కంటెంట్లో కొంత భాగాన్ని Google నుండి దాచడం మీకు అభ్యంతరం లేకపోతే, మీరు నిజంగా robots.txtని ఉపయోగించాల్సిన అవసరం లేదు!
మీరు robots.txt ఫైల్ను విస్మరిస్తే ఏమి జరుగుతుంది?
- మీరు Google శోధన ఇంజిన్ నుండి నిషేధించబడవచ్చు.
వెబ్సైట్ల గురించి సమాచారాన్ని ఎలా ప్రదర్శిస్తుందనే దాని గురించి Google సంవత్సరాలుగా అనేక సార్లు వారి విధానాలను మార్చింది. అయినప్పటికీ మారని ఒక విషయం ఏమిటంటే, robots.txt ఫైల్ని కలిగి ఉండటం వలన మీ వెబ్సైట్ Google శోధన ఫలితాల నుండి తీసివేయబడుతుంది. మీరు ఈ సమయంలో యాక్సెస్ చేయలేని పేజీలను సూచించే ఏవైనా లింక్లను కలిగి ఉంటే, Google బహుశా ఆ పేజీలను తన ఇండెక్స్ నుండి తీసివేస్తుంది. - శోధన ఇంజిన్ ఫలితాల పేజీలలో (SERP) మీ సైట్ కనిపించకపోవచ్చు.
వ్యక్తులు ఆన్లైన్లో ఏదైనా శోధించినప్పుడు, వారు సాధారణంగా Bing, Yahoo!, Google మొదలైన శోధన ఇంజిన్లను ఉపయోగిస్తారు. ఈ ఇంజిన్లు ఒకే విధమైన శోధన పదాలను కనుగొన్నప్పుడు, వారు వాటిని SERPలలో జాబితా చేస్తారు. మీరు ‘గంజాయి డిస్పెన్సరీ’ కోసం శోధిస్తున్నట్లయితే దీనికి మంచి ఉదాహరణ.
నేను robots.txtలో పేజీలను ఎలా బ్లాక్ చేయాలి?
శోధన ఇంజిన్ క్రాలర్లు మీ వెబ్సైట్ను ఎలా యాక్సెస్ చేయగలరో పరిమితం చేయడానికి Robots.txt ఫైల్లు ఉపయోగించబడతాయి. వ్యక్తులు మీ సైట్ని కనుగొనడానికి Googleని ఉపయోగించినప్పుడు, వారి బోట్ ఫైల్లో క్రాల్ చేస్తుంది మరియు వారు ఏమి చూడకూడదు మరియు చూడకూడదని గుర్తిస్తుంది. అది పూర్తయిన తర్వాత, బాట్లు మీ వెబ్సైట్ ద్వారా క్రాల్ అవుతున్న తదుపరి దశకు వెళ్తాయి.
- ఏదైనా పేజీకి లింక్లను అనుమతించండి (/robots.txt మినహా)
- ఇండెక్సింగ్ని అనుమతించవద్దు
ఇది పని చేసే విధానం చాలా సులభం: ఎవరైనా “గంజాయి పెంపకందారుల గైడ్” వంటి వాటి కోసం శోధిస్తే, రోబోట్ బోట్ అది చూసే మరియు చదివే కోడ్ యొక్క మొదటి లైన్ వద్ద ఆగిపోతుంది. ఈ సందర్భంలో, “నిరాకరించు” అనే పదాన్ని చూస్తే అది వెంటనే చదవడం ఆపివేస్తుంది. ఆ పాయింట్ నుండి ఇది దేనినీ ఇండెక్స్ చేయదని దీని అర్థం.
ఇది సున్నితమైన సమాచారాన్ని కలిగి ఉండే నిర్దిష్ట పేజీలను యాక్సెస్ చేయకుండా ఇతర బాట్లను నిరోధిస్తుంది. మీ సున్నితమైన డేటాను మరొకరు యాక్సెస్ చేయకూడదు!