Posts Tagged ‘中文’

DISCUZ的中文分词for php

星期六, 一月 30th, 2010

需要用中文分词来获取TAG
找了DISCUZ的觉得不错,是在线的,不需要本地的词库

<?php    
 
//强制使用字符集    
 
@header('Content-Type: text/html; charset=gbk');    
 
$subjectenc =$_POST['subject'];
 
 
 
$messageenc = preg_replace($_POST['message']);
 
 
$data = @implode('', file("http://keyword.discuz.com/related_kw.html?title=$subjectenc&content=$messageenc&ics=gbk&ocs=gbk")); 
 
if($data) {    
 
$parser = xml_parser_create();//建立一个 XML 解析器    
 
xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);    
 
xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);    
 
xml_parse_into_struct($parser, $data, $values, $index);//将 XML 数据解析到数组中    
 
xml_parser_free($parser);    
 
$kws = array();    
 
foreach($values as $valuearray) {    
 
  if(in_array($valuearray['tag'],array('kw','ekw'))) {   //kw ekw是什么意思?    
 
    $kws[] = iconv('utf-8','gbk',$valuearray['value']);//编码转换    
 
   }    
 
}}    
 
//最后出来的是数组.    
 
print_r($kws);    
 
?>

ubuntu9.10中文输入法ibus

星期五, 十一月 13th, 2009

首先
9.10使用了 IBUS作为默认的 输入法
但是一开始 还是被它困扰了
其实只要 手动添加下正确的 中文输入法 就 可以 了
进入IBUS设置

ibus

ibus
一定是那 个 PinYin
注意大小写
如果找不 到 这个选项
可能是语言包没有装好
一开始我 也 存在这个问题
到language里面 它会提示更新 的
更新完后重启
然后再设置ibus就可以看到 大写的PinYin了
把这个移动到最前面
切换方便
这个输入法比原来的SCIM强多了

可以为设置下自己 的 习惯
ibus设置