博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
SCWS分词扩展在WINDOWS下的安装方法
阅读量:5943 次
发布时间:2019-06-19

本文共 1766 字,大约阅读时间需要 5 分钟。

安装之前先确认您是否拥有主机的安装权限,否则无法进行安装,安装步骤如下:

 

1. 根据您当前用的 PHP 版本,下载相应已编译好的 php_scws.dll 扩展库。

   目前支持以下版本
  [PHP-4.4.x (44KB/VC6/ZTS)]  [PHP-5.2.x (44KB/VC6/ZTS)]  [PHP-5.3.x (40KB/VC9/ZTS)]
 [PHP-5.4.x (40KB/VC9/ZTS)]  [PHP-5.3.x (40KB/VC9/NTS)]  [PHP-5.4.x (40KB/VC9/NTS)]
 [PHP-5.3.x (44KB/VC6/ZTS)]
  下载地址为:http://www.xunsearch.com/scws/download.php

 

2. 将下载后的 zip 文件解压缩得到里面的 php_scws.dll ,将该文件放到 php 安装目录的

   ext/ 目录中去(通常为:X:/php/ext/)。

 

3. 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc

 

4. 从 scws 主页上下载词典文件和规则集文件,解压后将 *.xdb 和 *.ini 放到上述目录中

   SCWS 全部源代码,包括 libscws 核心库,命令行工具程序,php 扩展代码,规则集及文档。
   下载地址 http://www.xunsearch.com/scws/down/scws-1.2.2.tar.bz2
   规则集:在源码文件的etc文件夹中
   词典系列:http://www.xunsearch.com/scws/download.php XDB 词典文件 位置

 

5. 修改 php.ini 通常位于 C:/windows/php.ini 或 C:/winnt/php.ini 之类的目录,

   在 php.ini 的末尾加入以下几行:

 

[scws]

;
; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
; 再把 php_scws.dll 指定为绝对路径。
;
extension = php_scws.dll

以下参数可选

scws.default.charset = gbk
scws.default.fpath = "c:/program files/scws/etc"

 

6. 重启 web 服务器即可完成。

测试程序:

test1.php

<?php
$so = scws_new();
$so->set_charset('gbk');
// 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件
$so->send_text("我是一个中国人,我会C++语言,我也有很多T恤衣服");
while ($tmp = $so->get_result())
{
  print_r($tmp);
}
$so->close();
?>

test2.php

<?php
//实例化分词插件核心类
 $so = scws_new();
 //设置分词时所用编码
 $so->set_charset('utf-8');
 //设置分词所用词典(此处使用utf8的词典)
 $so->set_dict('dict.utf8.xdb');
 //设置分词所用规则
 $so->set_rule('etc/rules.utf8.ini ');
 //分词前去掉标点符号
 $so->set_ignore(true);
 //是否复式分割,如“中国人”返回“中国+人+中国人”三个词。
 $so->set_multi(true);
 //设定将文字自动以二字分词法聚合
 $so->set_duality(true);
 //要进行分词的语句
 $so->send_text("我是中国人,我不喜欢吃喝玩乐");
 //获取分词结果,如果提取高频词用get_tops方法
 //    $tmp = $so->get_tops(5,'al,n');

 while ($tmp = $so->get_result())

 {
     print_r($tmp);
 }
 $so->close();

 ?>

转载地址:http://xkwxx.baihongyu.com/

你可能感兴趣的文章
SFB 项目经验-40-Skype for Business-呼入正常-呼出不正常
查看>>
吴忌寒江卓尔批“闪电网络”背后,是链圈和矿圈的的利益之争
查看>>
python的cls,self,classmethod,staticmethod
查看>>
应用系统中常见报表类型解析
查看>>
[Silverlight入门系列]使用MVVM模式(9): 想在ViewModel中控制Storyboard动画?
查看>>
3 项目计划
查看>>
SQL Server 2008 下载地址(微软官方网站)
查看>>
如何对已经发布过的InfoPath模板进行修改
查看>>
推荐系统高峰论坛
查看>>
移动互联
查看>>
basic4android 开发教程翻译(三)IDE 小贴士
查看>>
看看async,await 是如何简化异步的调用WCF!
查看>>
obj-c 定义一个类
查看>>
电脑APK
查看>>
计数器的代码的原理分析
查看>>
HDU-4335 What is N? 欧拉函数,欧拉定理
查看>>
HDU 1044 Collect More Jewels(搜索,先bfs再dfs)
查看>>
使用RabbitMQ过程中遇到的一个问题(队列为空,但内存暴涨)以及与开发者的邮件沟通...
查看>>
C++/C学习笔记(九)
查看>>
ASP.net MVC 中Security.FormsAuthentication验证用户的状态(匿名|已登录)
查看>>