久久久久av_欧美日韩一区二区在线_国产精品三区四区_日韩中字在线

Discuz! 官方交流社區

標題: 請問一下官方管理人員:/?about_20/這種頁面是怎么產生的? [打印本頁]

作者: 你若安好那還得了    時間: 2024-12-1 18:40
標題: 請問一下官方管理人員:/?about_20/這種頁面是怎么產生的?
請問一下官方管理人員:/?about_20/這種頁面是怎么產生的?有什么辦法讓這種頁面變成404頁面?之前我以為是我程序的問題,然后嘗試打開官方論壇的地址后面加上這種路徑,發現也是打開首頁,一樣的問題存在,像請問一下怎么禁止掉這樣的頁面,可恨的是這樣的頁面還被百度收錄了。

(, 下載次數: 24)


作者: qzuser1212    時間: 2024-12-1 19:09
我不是官方管理人員哦,但我可以給你講講這類情況大致的原因和可能的解決辦法呀。

### 一、這種頁面產生的原因
1. **程序錯誤或配置不當**:
    - 如果你的網站是基于某種程序搭建的(比如常見的WordPress、Drupal等內容管理系統,或者自己開發的Web應用程序),可能在程序代碼里存在一些漏洞或錯誤的路由配置。比如在處理動態頁面請求時,沒有對不合理的路徑參數進行正確校驗,就可能導致類似“/?about_20/”這樣奇怪的路徑被錯誤地解析并嘗試呈現內容,結果可能就出現了類似打開首頁這樣不符合預期的情況。
    - 服務器端的Web服務器軟件(如Apache、Nginx等)配置也可能存在問題。例如,沒有正確設置對特定路徑格式的處理規則,導致它默認將這種無法識別的路徑重定向到了首頁或者進行了不恰當的處理。
2. **搜索引擎抓取異常**:
    - 百度等搜索引擎在抓取網頁時,可能會因為一些網絡波動、網站自身的robots.txt文件設置不合理等原因,錯誤地抓取到了一些本來不該出現或者不存在實際對應內容的路徑,然后將其收錄。比如你的robots.txt文件如果沒有正確禁止搜索引擎抓取這類奇怪路徑的頁面,搜索引擎的爬蟲就可能會把它們當作正常頁面抓取并收錄。

### 二、讓這類頁面變成404頁面的辦法
1. **服務器端配置修改**:
    - **Apache服務器**:
        - 可以在網站根目錄下的.htaccess文件(如果沒有可以創建一個)中添加類似如下的重定向規則,將這類不明路徑重定向到404頁面。例如:
```
RewriteEngine On
RewriteCond %{REQUEST_URI} ^/?about_20/$
RewriteRule ^(.*)$ /404.php [L,R=404]
```
這里假設你的404頁面是404.php,你可以根據實際情況修改。這條規則的意思是,當請求的URI(統一資源標識符,也就是網址路徑部分)匹配“/?about_20/”時,就將請求重定向到404.php頁面,并且返回404狀態碼。
    - **Nginx服務器**:
        - 在Nginx的配置文件(通常在/etc/nginx/nginx.conf或者網站對應的server塊配置文件中)中添加如下規則:
```
location ~ ^/?about_20/$ {
    return 404;
}
```
這就直接告訴Nginx,當遇到匹配“/?about_20/”這樣路徑的請求時,直接返回404狀態碼。
2. **程序層面處理**:
    - 如果是基于某種內容管理系統或者自己開發的程序,需要在程序代碼中對這類不合理的路徑進行識別和處理。
    - 例如,在處理頁面請求的代碼邏輯里(比如在PHP中可能是在index.php或者相關的路由處理文件中),添加條件判斷來檢測是否是類似“/?about_20/”這樣的異常路徑,如果是,就直接輸出404頁面的內容并設置正確的404狀態碼。以下是一個簡單的PHP示例(假設你的網站是PHP開發的):
```php
<?php
$request_uri = $_SERVER['REQUEST_URI'];
if ($request_uri === '/?about_20/') {
    // 這里假設你的404頁面內容是通過一個函數generate_404_page()來生成的
    $404_content = generate_404_page();
    header('HTTP/1.1 404 Not Found');
    echo $404_content;
    exit;
}
// 其他正常的頁面處理邏輯繼續往下走
?>
```
3. **更新robots.txt文件**:
    - 確保你的robots.txt文件正確設置了禁止搜索引擎抓取這類不合理路徑的頁面。例如,添加如下規則:
```
User-agent: *
Disallow: /?about_20/
```
這表示對所有的搜索引擎爬蟲(User-agent: * 代表所有),禁止它們抓取“/?about_20/”這個路徑的頁面。這樣可以在一定程度上避免搜索引擎繼續收錄這類不合理的頁面,并且也有助于引導搜索引擎重新評估你網站的頁面結構,去除已經收錄的這類異常頁面的索引(不過這個過程可能需要一些時間,因為搜索引擎重新索引也有自己的周期)。

希望這些方法能對你解決這個問題有所幫助呀,你可以根據自己網站的具體情況(比如使用的服務器類型、程序語言等)來選擇合適的解決辦法。
作者: 你若安好那還得了    時間: 2024-12-1 21:41
qzuser1212 發表于 2024-12-1 19:09
我不是官方管理人員哦,但我可以給你講講這類情況大致的原因和可能的解決辦法呀。

### 一、這種頁面產生的 ...

感謝你的回復,之前我觀察過這個問題,只是這個頁面正好被百度收錄了,我看其他的類似這樣的百度蜘蛛也爬過,/?about_20/,這其中的20只是其中一個,其他的比如19  18  17 都跟首頁一樣
作者: ysx24    時間: 2024-12-2 11:00
我用的是 https://addon.dismall.com/plugins/nciaer_thread404seo.html
實測https://xxxx.com/后面的任何不存頁或者帖子不存在錯誤頁都會 (, 下載次數: 28)
實測有效

還有一種就是寶塔設置404錯誤頁,不過效果不是太理想
作者: crx349    時間: 2024-12-2 13:00
不存在頁面,建議用搜索引擎模擬工具抓取下內容,判斷是否安全問題哦
作者: 你若安好那還得了    時間: 2024-12-2 13:37
ysx24 發表于 2024-12-2 11:00
我用的是 https://addon.dismall.com/plugins/nciaer_thread404seo.html
實測https://xxxx.com/后面的任何 ...

我不知道我這種問題,這個插件能解決不
作者: 你若安好那還得了    時間: 2024-12-2 18:23
crx349 發表于 2024-12-2 13:00
不存在頁面,建議用搜索引擎模擬工具抓取下內容,判斷是否安全問題哦

它是跟首頁一模一樣
作者: 你若安好那還得了    時間: 2024-12-3 17:57
@湖中沉 @dashen @LooTan
作者: 湖中沉    時間: 2024-12-3 18:38
?問號后面的隨便輸入什么都行只要沒有注入風險,都可以,這是很正常的
作者: 你若安好那還得了    時間: 2024-12-3 19:08
湖中沉 發表于 2024-12-3 18:38
?問號后面的隨便輸入什么都行只要沒有注入風險,都可以,這是很正常的

我的意思是怎么杜絕這種地址產生,讓輸入這種地址的鏈接直接404
作者: 湖中沉    時間: 2024-12-4 08:13
你若安好那還得了 發表于 2024-12-3 19:08
我的意思是怎么杜絕這種地址產生,讓輸入這種地址的鏈接直接404

基本上是做不到的,因為這是一些無效參數,你可以試試看別的站,不限于DZ,只要問號后面加隨意內容,都是可以訪問的




歡迎光臨 Discuz! 官方交流社區 (http://www.9999xn.com/) Powered by Discuz! W1.0