來玩玩u2u好了

u2u是什麼?是聯合報的一種網站新聞標題交換頁面語法,前面很多討論都或多或少提到了。(那一串亂七八糟的討論好像也無形間幫u2u做了廣告?)我剛剛註冊了一個,試試看效果如何。

亂碼…。

看樣子只提供 Big5 中文,不提供 UTF-8 編碼的樣子,這年頭做網站徘徊在這幾種編碼方式之間真麻煩。話說我這陣子也被 Twiki 的 Big5 搞得七葷八素,我之前應該提過我用 Twiki 弄一個教學網站,中文某種程度上是可以用的,不過如果你要拿 UTF-8 中文當 WikiWord,由於 TWiki 的檔案用的是 file system 以及 RCS、egrep等工具,將每個 WikiWord 儲存為文字檔的檔案名稱,可是有些作業系統不支援 UTF-8 做為檔案名稱,如果你用的是 Big5 編碼,也很慘,因為現在 WindowsXP 的 IE一律將 URL 當中的中文以 UTF-8 判讀,所以你在其他平台上面瀏覽器看沒事,你在 WinXP 上就死得亂七八糟,而且 egrep 好像對中文中有 / 字元的文字也判斷得不甚理想…。

什麼是Wiki?在hlb以及Schee的weblog上可以看到更多的相關討論。另外在Wikila上也可以看到關於Wiki的說明。

所以想想,在目前的中文新聞交換中,已經實作比較理想的,好像還是RSS feed,即便用 Big5 或 UTF-8 編碼,你用 perl 或 php 當中的模組,都可以對中文做適當的解譯。(雖然說我個人更期待出現像AVML)這類的新聞交換。

順道一提,之前在「網站建置百寶箱」網站上,也有提到類似的語法,可以取用東森以及PChome的即時新聞,範例如下。

東森:

PChome:

我自己發現中時的也可以這麼用…。

不曉得同樣的東西,東森與PChome的授權如何?來去瞭解一下。

10 thoughts on “來玩玩u2u好了

  1. 呃,其實不是其他家的標題用 UTF-8 編碼,而是因為我用的是 iframe 語法給「框」進來,也就是說,這種引用方式是另外在頁面中開了一個 frame,而udn則是直接用java script 的 document.write()語法插入在頁面中。

  2. 而在每個frame中,其實頁面還是Big5編碼的文字,而是瀏覽器在判斷的時候,對不同的frame的編碼做不同的判讀。

    其實我覺得做新聞交換,用 Java Script 也不見得是一個好選擇,比方說我之前在我的個人網站上,將英文日期改成用民國幾年這種中文日期時,我也是用Java Script亂寫,但後來發現某些瀏覽器對於Java Script的支援似乎不盡理想,比方說IE 5.0,我後來受不了,就把這些先前放在瀏覽器端的事情拉回server端做,換成用 php去寫。

  3. 但我之前的說法又綁在一個限制上,那就是,要將新聞的中文內容做適當的判斷,這些工作如果是放在server端來做,則架設網站的人則必須有足夠的權限,以現在大多個人站台免費的web hosting來說,連cgi都不允許執行,能夠支援php的更少,除非付錢,或自己架主機,這麼一來便拉高了技術的門檻。

    但是如果就聯合報社這樣的商業公司來說,要將一套新聞交換技術,只推廣給擁有系統管理權限的用戶,好像也不甚適當。感覺起來似乎是有點兩難。

  4. 所以如果要繼續用 JavaScript 開發這麼套新聞交換,我建議最好在聯合報的主機上,用轉碼工具,同時產生兩份 Java Script Source,姑且一份叫做 u2u Big5,另一份叫做 u2u UTF-8 好了,這麼一來可以針對這兩套現在並行的正體中文編碼的需求,讓使用者選用。

  5. 學長真懂……實在心生佩服……
    是否是php語法的網站,不支援utf-8?而大部份使用分享軟體的weblog或是forum網站都是php寫的?那網站數究竟有多少呢?
    在商業掛帥的前提下,是否又不該做2種(big5及utf-8)的網頁?再者,搞網站的人或公司,又是否真的懂要選用big5還是utf-8哪種寫法的網頁?
    還是也做個iframe,把document.write的js檔包起來就好了?

Comments are closed.