清理垃圾代碼是指刪除頁面中的多余代碼。一個頁面經(jīng)過垃圾代碼清理后,可以刪除接近80%的多余代碼。然而,什么樣的代碼才是垃圾代碼呢?
1.垃圾代碼簡
垃圾代碼就是指刪除后不會影響頁面正常顯示的非必要的代碼。這些代買占據(jù)著龐大的空間,不但消耗用戶下載頁面的時間,還占用搜索引擎巨大的存儲空間,增加搜索引擎分析數(shù)據(jù)的時間。然而,這么龐大的垃圾代碼是如何產(chǎn)生的呢?
2.垃圾代碼的產(chǎn)生
一般情況下,我們會使用網(wǎng)頁制作軟件制作網(wǎng)頁,如FrontPage、Word及Dreamweaver。這些網(wǎng)頁制作軟件在制作網(wǎng)頁的時候,會生成相應的HTML代碼,其中大部分是必要的,而有一小部分則是可有可無的,這就是所謂的垃圾代碼。因此,避免產(chǎn)生垃圾代碼最好的辦法就是以手工編寫代碼的方式制作網(wǎng)頁。
即使是同樣內(nèi)容的網(wǎng)頁,使用不同的網(wǎng)頁制作軟件進行制作,所產(chǎn)生的代碼也會存在很大的區(qū)別。在沒有掌握手工編寫代碼前,可以使用Dreamweaver制作網(wǎng)頁,完成后再清理其中的垃圾代碼。
3.垃圾代碼的清理
〇空格
空格字符是網(wǎng)頁中最常見的垃圾代碼。但此處討論的空格字符并非HTML語言中的“ ;”標簽,而是指在代碼編輯環(huán)境下敲擊鍵盤上的空格鍵所產(chǎn)生的符號。網(wǎng)頁中每個空格都相當于一個字符,因此,空格字符也會占用巨大的空間。初步同濟,空格字符約占用頁面總體積的1.5%。也就是說,一個100KB的頁面中,其中1.5KB是空格字符。
空格字符通常會出現(xiàn)在每行代碼的開始和結束處,還有就是空行中。
(1)每行代碼開始前的空格字符:是網(wǎng)頁制作軟件生成代碼時,默認產(chǎn)生的縮進字符。
(2)每行代碼結束處的空格字符:是編輯HTML代碼時,不小心加上的。只要我們在每行代碼的結束位置向右移動光標,如果光標不換行,則說明該頁面還存在空格字符。
(3)空白行:在編寫代碼時,常利用空行或者注釋對不同功能模塊進行分隔,這樣就產(chǎn)生了空白行。
對于頁面中不同位置上的空格字符,清理的方式也有嗦不同,下面介紹幾種常用的空格字符清理方法。
每行代碼開始前的空格字符
對于每行代碼開始錢的空格字符,可以使用Dreamweaver或者EditPlus等軟件進行清理。具體操作步驟如下:
(1)轉至HTML代碼編輯模式(如果是Dreamweaver);
(2)按Ctrl+A選擇全部代碼;
(3)使用組合鍵Shift+Tab,直至刪除所有空格為止。
下面的代碼1是清理空格前的效果,而代碼2則是清理空格字符后的效果。
代碼1:
<table width="100%" border="0" cellsoacing="0" cellpadding="0">
<tr>
<td> </td>
</tr>
<tr>
<td> </td>
</tr>
<tr>
<td> </td>
</tr>
</table>
代碼2:
<table width="100%" border="0" cellsoacing="0" cellpadding="0">
<tr>
<td> </td>
</tr>
<tr>
<td> </td>
</tr>
<tr>
<td> </td>
</tr>
</table>
空行
對于空行中空格字符的清理,只能手工逐行去掉。
(1)首先,使用鼠標選擇空行;
(2)再按Delete鍵,即可刪除空行。
每行代碼結尾處的空格字符對于每行代碼介紹處的空格字符,我們可以使用Editplus或者其他文筆編輯軟件的替換功能進行清理:
(1)用鼠標選擇“>”+“一個空格字符”,即“>”;
(2)再按Ctrl+F,就會彈出一個窗口;
(3)“替換”處填上“>”,再點擊“全部替換”即可。
頁面經(jīng)過清理空格字符后,大概可以刪除70%左右的垃圾代碼。也就是說,空格字符的代碼量大概占總垃圾代碼的70%,還有30%左右的垃圾代碼分布在默認屬性、注釋語句及空語句中。
〇默認屬性
在利用網(wǎng)頁制作軟件制作網(wǎng)頁時,通常會產(chǎn)生一些默認屬性的代碼。例如,我們在HTML代碼中不添加左對齊屬性,頁面中的內(nèi)容也是以左對齊的方式顯示的,所以代碼中的左對齊屬性是可以刪除的。
在頁面中,還有很多其他屬性都是默認屬性,以下是比較常見的。
(1)align=“l(fā)eft”:橫向居左對齊屬性值,默認情況下文章或者圖片都是橫向居左對齊的。
(2)valign=“middle”:豎向居中對齊屬性值,默認情況下文章或者圖片都是豎向居中對齊的。
(3)size=“3”:文字大小屬性值,默認情況下是3號字體。
(4)target=”_self“:新頁面打開屬性值,默認情況下網(wǎng)頁中文本的字體顏色是黑色。
利用Dreamweaver的替換功能,可以完成對默認屬性代碼的替換。在“查找”中填上要替換的默認屬性代碼,“替換”處留空白,還可以在“查找范圍”上選擇替換范圍,然后點擊“替換全部”就可以刪除“產(chǎn)照范圍”內(nèi)所有指定的默認屬性代碼。
〇注釋語句
注釋語句是用于對代碼功能或作用進行說明的語句,注釋語句里的內(nèi)容對于普通用戶來說就是不可見的。即普通用戶在頁面中是看不到HTML代碼中注釋標簽里的內(nèi)容。
在制作網(wǎng)頁的時候,我們或多或上會添加注釋語句一增強代碼的可讀性。但是,過多的注釋語句會占用大量的存儲空間。不僅如此,如果在注釋標簽里添加大量的關鍵字,還會被搜索引擎認為是堆砌關鍵字,從而對網(wǎng)站進行懲罰。
所以,在添加注釋語句時,我們要堅守一個院長:絕不添加哪些即使刪除后也不會影響網(wǎng)頁源代碼可讀性的注釋語句。
〇空語句
垃圾代碼清理的最后一步就是刪除代碼中的空語句。簡單地說,空語句就是指標簽間不存在任何內(nèi)容的語句。
空語句的清理主要針對即使刪除后也不會影響頁面正常顯示的標簽。但有一部標簽是不能刪除的(如<tr>、<td>),否則頁面將會出現(xiàn)錯亂。
手工編寫HTML代碼是搜索引擎優(yōu)化從業(yè)者必須具備的基本技能。如果你已經(jīng)具備手工編寫HTML代碼的能力,就應該有限采用手工編寫代碼的方式制作網(wǎng)頁。
經(jīng)過垃圾代碼清理后,頁面中70%以上的多余代碼已經(jīng)被清楚,但是,精簡代碼的工作并沒有完成。接下來就是暫緩HTML中的長標簽,以及對CSS,JavaScript進行優(yōu)化
轉載請保留原文地址: http://m.448gfe.cn/show-557.html