虛詞是無助於搜尋的字,例如 the 或 an。特殊語言的虛詞清單是儲存在該語言的虛詞檔案中。Microsoft Office SharePoint Portal Server 2003 提供下列語言的虛詞檔案:
如果沒有特殊語言的虛詞檔案,則使用中性虛詞檔案 (noiseneu.txt)。對應語言的斷詞工具會剖析虛詞。
根據預設,SharePoint Portal Server 會將虛詞檔案儲存在伺服器的下列目錄中: \Program Files\SharePoint Portal Server\DATA\Config。如果您在安裝伺服器時將資料檔案安裝在其他位置,則資料目錄就會位在其他地方。如果變更這個路徑,只會影響日後安裝的搜尋應用程式。若要變更現有安裝行為,請參閱本節後面的段落,會提供完整路徑。
您可以編輯虛詞檔案。如果新增虛詞,可能會影響搜尋的準確度,但內容索引也會變小,可以提高效能。若要搜尋作業傳回這些字,可以刪除虛詞。
一旦移除虛詞檔案中的字,就看不到效果,除非重設內容索引並且全面更新。當系統管理者移除虛詞檔案中的字時,在索引包括檔案之前,這些字會先從檔案中移除。因此您必須在修改虛詞清單後,更新索引。否則,查詢這些字詞時,將不會傳回含有已移除之虛詞的文件。
您不應該刪除虛詞檔案。如果不想在更新或查詢時移除虛詞,請移除檔案中的所有項目。如果刪除檔案,所有單一字元都會被當作虛詞而刪除。
虛詞檔案會被複製到 \Program Files\SharePoint Portal Server\DATA\Applications\Application UID\Config。您可以在應用程式階層 (而非伺服器或伺服器陣列階層) 指定虛詞。例如,如果 SharePoint Portal Server 及 Microsoft SQL Server 安裝在同一部伺服器上,則雙方都會具有不同的虛詞清單。
祕訣 若要在內容索引中包括所有字 (甚至是虛詞),就應該刪除現用語言的虛詞檔案中的所有項目,讓資料目錄中的檔案變成空的。如果刪除這個檔案,中性虛詞檔案會防止索引包括虛詞。
建議 若要移除虛詞檔案中的字,建議您重設內容索引 (如需重設索引的詳細資訊,請參閱重設內容索引)。移除清單中的虛詞時,查詢作業會發出有效的字詞,但變更前包括在索引中的文件,因為移除虛詞之故,所以不會有字詞的例項。新增虛詞時,在新增字之後所執行的任何查詢作業都會移除該字詞。因此,該字詞不會傳回查詢結果。
如果使用者從入口搜尋,SharePoint Portal Server 會把一些查詢字詞當作是虛詞而放棄 (即使字詞本身不是虛詞也一樣)。當字詞是從虛詞變化而來時,就會發生這種情形。例如,當虛詞檔案中有「be」時,如果您搜尋「am」,則「am」會被當作是虛詞,因為它是「be」的一種變形。如果使用者搜尋虛詞,入口就不會傳回結果。