PHP、XML、以及字元編碼:一則關於悲情、憤怒以及傷逝(資料)的故事

譯者按:

我不是很喜歡在翻譯文章的時候插嘴,不過在讀這篇文章前,交代一下這篇文章的大致脈絡,或許可以幫助您做比較充分的了解。

這是一篇血淚交織的技術文章,原作者是我們的朋友,台灣女婿Steve Minutillo。Steve是Feed on Feeds(簡稱FoF)的作者,FoF是一套架設在伺服器端,透過網頁讀取各站台RSS以及Atom格式新聞的匯集閱讀程式(aggregator),或簡單說,如果你有支援 PHP 以及 MySQL 的主機空間,你可以使用 FoF,自己架設一套類似台灣部落格Meerkat的網頁新聞閱讀平台,不過卻是專屬你自己使用。

Steve最近在做FoF的改版工作,在這個星期內,已經先後釋出了0.1.4、0.1.5及0.1.6版,在最近的改版中,主要針對的是介面的調整,符合XHTML規格,以及對台灣或遠東地區使用者來說最重要的,預設採取UTF-8編碼以及多國字元的處理。在釋出0.1.6版時,我問了個問題:「可以將BIG5或GB2312等編碼的文字,轉換成UTF-8嗎?」Steve於是便很悲憤的繼續製作FoF 0.1.7版,並且寫下了這篇悲憤的文章。

簡單來說,目前的 PHP 環境,在多國語文處理方面,可說非常糟糕,而Steve為了可以讓各國使用者都可以順利使用 FoF,則不斷在目前的困境中,尋找可能的解決之道,而我覺得,這篇文章對於遠東地區的使用者來說,要解決在 PHP 處理多國語文的需求,也是相當有參考價值。

Continue reading

cwTeX排版文件簡易產生器

或許任何一種寫作的背後都有行動上的意義,無論是多麼沒有質感、多麼枯燥乏味的技術文件都在企圖改變這個世界的無知,而依照公文手冊規範繕造打印的各式公文各式呈函令稿、各種矯揉虛浮的商務文書還有應用文,才是這個世界運作的方式,而在你企圖拋棄這些無聊實用價值的寫作中,從來卻沒有更積極的意義,藝術從來就沒有誕生過,誕生的只有一次又一次的暴露與表態。在這個令人做噁的時刻也或許弄一些小玩意讓自己方便些,或許還比較可以提供更多更充足的想像,可以讓自己以為這個世界有可能變得更美好。

cwTeX排版文件產生器
Continue reading

SYSTRAN: 英文網站線上中文翻譯 bookmarklet

SYSTRAN

煩死了,實在煩死了。一早就不斷有人跟我抱怨連宋提起無效之訴、發動群眾包圍總統府的總總,又有人不斷告訴我CNN有台灣選舉是否公平的民調之類的消息,三二○的種種,老實說我現在一句話都不想聽到。所以悶著頭,弄個小工具,調劑一下自己的身心。

我弄了一個可以快速使用SYSTRAN線上翻譯服務的書籤小程式(bookmarklet)。SYSTRAN是一家做翻譯軟體的廠商,除了提供在個人單機使用的翻譯軟體外,在SYSTRAN的網站上,也提供了線上即時翻譯服務,有付費的,也有免費的,您可以在文字輸入框當中輸入文字後,將所輸入的文字翻譯成您所指定的語文,也可以輸入網址(URL),翻譯您所指定的網頁。在中文的支援方面,包括了簡體中文與英文、以及繁體中文與英文之間的翻譯,就目前的其他線上翻譯服務來說,Google的服務中還沒有包括中文,AltaVista則只有簡體中文翻譯。

不過,如果您要翻譯某個網頁,一定要連到SYSTRAN的網頁再輸入網址,還是有些麻煩,所以如果在您瀏覽網頁時,按一個按鈕,便可以立刻翻譯目前所看到的網頁,那就方便多了。這種比較方便、舒服的使用環境,SYSTRAN自然也想的到,不過他們的作法是做成了一個IE裡頭的工具列,要用這個工具列,您要付費購買,網站上可以看到的軟體套餐很多,最便宜的從五十九元美金起跳。

我所製作的這個擋人財路的書籤小程式,目前只能將英文網站翻譯成繁體中文,因為SYSTAN也沒有辦法將其他語文翻譯成中文,而除了中英轉換之外,其他三十五種翻譯方式,對我而言似乎沒有多麼實用。要使用這個書籤小程式,請在下方的連結上,點選滑鼠右鍵,然後加入到「我的最愛」或「書籤」中。

SYSTRAN翻譯

要使用的時候,直接從「我的最愛」或「書籤」中,選擇這個書籤即可。

另外,SYSTRAN在設計上有一個比較討厭的地方,如果您使用了一定次數的翻譯,SYSTRAN會告訴你,你已經使用了太多次,請加入付費服務。這怎麼辦呢?SYSTRAN是使用COOKIE的方式儲存您的使用次數,所以只要拒絕SYSTRAN的Cookie,就可以解決這個問題。如果您使用IE,那麼請用工具→網際網路選項→隱私→網站→編輯,如果您用的是Mozilla Firebird,那麼請在工具→選項→個人隱私→Cookies→例外,加入www.systranbox.com這個網站,然後設定為拒絕即可。

Blobsy:MSN聊天機器人

Bobsy雖然沒有什麼統計數據支撐,我相信台北人的網路生活,泰半是由瀏覽網頁、以及用MSN Messenger與人在線上直接對話傳訊所構成的。如果您也是每天打開電腦就自動連上MSN的話,那麼除了新增各種心情小圖示(smilies),或是想辦法抓到什麼去廣告可多重開啟的修改版之外,不妨看看MSN還有什麼其他可能的玩法。

Blobsy是由Maldivian Underground的Jawish Hameed所開發,使用PHP所寫成的MSN聊天機器人,是使用GPL授權的自由軟體,只要是能夠執行PHP的平台(包括Windows以及*nix),均可使用,最新版本是在今年一月時釋出的1.5版。雖然說是機器人,不過Blobsy並不是所謂的Chat bot,那種可以根據你所說的話,自動作語意分析判斷,從語料資料庫當中讀取資料答話,讓您在無聊的時候假裝有人可以陪你聊天那樣的機器人,而是當機器人上線時,您可以透過MSN傳訊軟體,在對話中用一些簡單的指令,要求機器人幫你做一些事情,以內建功能來說,您可以要求機器人幫你上Google查資料。而這些指令都是由一個個簡潔的模組(module)所組成,所以只要您稍微懂一些PHP,那麼便可以輕易開發出自己所想要的功能。
Continue reading