-
Notifications
You must be signed in to change notification settings - Fork 47
Scripting
librime-lua 是 RIME 输入法引擎的一个插件,它为用户提供了使用 lua 脚本语言扩展输入法的能力。通过 lua,您可以实现输入任意动态短语(如日期时间、大写数字、计算器)、自由重排/过滤候选词,甚至云输入等,单纯使用配置文件难以做到的,灵活多样的功能。本文将介绍本项目的配置和编程方法。
要理解本项目的工作原理,需先了解 RIME 功能组件的基本概念与工作流程,见RIME文档。简而言之,librime-lua 提供了 processor、segmentor、translator 和 filter 这四个功能组件的开发接口。下面首先通过一个例子来说明完整的流程,然后再详细介绍各个组件的编程接口。
我们通过“输入今天的日期”这个例子,来说明开发定制的流程。一共分三步:编写代码、配置方案、重新部署。
输入日期,需要用到 translator。我们希望在输入“date”之后,在输入法候选框中得到今天日期。我们在 RIME 的用户目录下新建一个 rime.lua
文件,这是整个 lua 脚本的总入口。在文件中录入以下内容:
function date_translator(input, seg)
if (input == "date") then
--- Candidate(type, start, end, text, comment)
yield(Candidate("date", seg.start, seg._end, os.date("%Y年%m月%d日"), " 日期"))
end
end
上面实现了一个叫做 date_translator
的函数。它的输入是 input
和 seg
,分别记录了 translator 需要翻译的内容和它在输入串中的位置。这个函数会判断输入的是否是“date”。如是则生成一个内容为今天日期的候选项。候选项的构造函数是 Candidate
。这个函数如注释所说有五个参数:类型、开始位置、结束位置、候选内容和候选注释。类型可以是任意字符串,这里用了"date"
;开始、结束位置一般用 seg.start
和 seg._end
就可以,它表示了我们要将整个待翻译的输入串替换为候选内容;候选内容是使用 lua 的库函数生成的日期;候选注释一般会在输入候选框中以灰色展示在候选内容旁边。候选项生成以后是通过 yield
发出的。yield
在这里可以简单理解为“发送一个候选项到候选框中”。一个函数可以 yield
任意次,这里我们只有一个候选项所以只有一个 yield
。
我们已经编写了输入日期的 translator,为了让它生效,需要修改输入方案的配置文件。以明月拼音为例,找到 luna_pinyin.schema.yaml
,在 engine/translators
中加入一项 lua_translator@date_translator
,如下:
engine:
...
translators:
- lua_translator@date_translator
...
这样就完成了配置。它表示从 lua 执行环境中找到名为 date_translator
的全局实例,将它作为一种 translator 安装到引擎之中。其他类型的组件配置类推,分别叫做 lua_processor
lua_segmentor
lua_filter
。
以上完成了所有开发和配置。点击“重新部署”,输入"date",就可以看到候选框中出现了今天的日期。
在本项目的 sample
目录下,还有更多的例子。配合其中的注释并稍加修改,就可以满足大部分的日常需求。
本节详细介绍编程接口。需注意随着项目的开发,以下文档可能是不完整或过时的,敬请各位参与贡献文档。
lua_translator
提供了 translator 的开发接口。它在配置文件中的配置语法有两种,分别是:
engine:
translators:
- lua_translator@lua_object_name
- lua_translator@lua_object_name@name_space
其中 lua_object_name
是 lua 环境中的一个全局对象,可能是一个 lua function 或者一个 lua table。后面的 name_space
当出现时是 translator 名字,与 RIME 组件配置中出现的 @
意义一致。
lua_object_name
所指对象有多种形式:
--- 简化形式1
function translator(input, seg)
...
end
--- 简化形式2
function translator(input, seg, env)
...
end
--- 完整形式
{
init = function (env) ... end,
func = function (input, seg, env) ... end,
fini = function (env) ... end
}
简化形式是 lua function,此函数即为 translator 的工作函数。无返回值。可以通过 yield
发送 Candidate
对象。
参数:
-
input
:字符串,为待翻译串。 -
seg
:Segment
对象。 -
env
:lua table 对象。预设engine
和name_space
两个成员,分别是Engine
对象和前述name_space
配置字符串。
完整形式是 lua table,其中 func
与简化形式意义相同。init
与 fini
分别在 lua_translator
构造与析构时调用。
lua_filter
提供了 filter 的开发接口。它在配置文件中的配置语法有两种,分别是:
engine:
filters:
- lua_filter@lua_object_name
- lua_filter@lua_object_name@name_space
其中 lua_object_name
是 lua 环境中的一个全局对象,可能是一个 lua function 或者一个 lua table。后面的 name_space
当出现时是 filter 名字,与 RIME 组件配置中出现的 @
意义一致。
lua_object_name
所指对象有多种形式:
--- 简化形式1
function filter(input)
...
end
--- 简化形式2
function filter(input, env)
...
end
--- 完整形式
{
init = function (env) ... end,
func = function (input, env) ... end,
fini = function (env) ... end,
tags_match = function (segment, env) ... end --- 可选
}
简化形式是 lua function,此函数即为 filter 的工作函数。无返回值。可以通过 yield
发送 Candidate
对象。
参数:
-
input
:Translation
对象,为待过滤的Candidate
流。 -
env
:lua table 对象。预设engine
和name_space
两个成员,分别是Engine
对象和前述name_space
配置字符串。
完整形式是 lua table,其中 func
与简化形式意义相同。init
与 fini
分别在 lua_filter
构造与析构时调用。tags_match
出现时覆盖 filter 的 TagsMatch
方法。
lua_processor
提供了 processor 的开发接口。它在配置文件中的配置语法有两种,分别是:
engine:
processors:
- lua_processor@lua_object_name
- lua_processor@lua_object_name@name_space
其中 lua_object_name
是 lua 环境中的一个全局对象,可能是一个 lua function 或者一个 lua table。后面的 name_space
当出现时是 processor 名字,与 RIME 组件配置中出现的 @
意义一致。
lua_object_name
所指对象有多种形式:
--- 简化形式1
function processor(key_event)
...
end
--- 简化形式2
function processor(key_event, env)
...
end
--- 完整形式
{
init = function (env) ... end,
func = function (key_event, env) ... end,
fini = function (env) ... end
}
简化形式是 lua function,此函数即为 processor 的工作函数。返回值为整数:
- 0 表示
kRejected
字符上屏,结束 processors 流程 - 1 表示
kAccepted
字符不上屏,结束 processors 流程 - 2 表示
kNoop
字符不上屏,交给下一个 processor
参数:
-
key_event
:KeyEvent
对象,为待处理的按键。 -
env
:lua table 对象。预设engine
和name_space
两个成员,分别是Engine
对象和前述name_space
配置字符串。
完整形式是 lua table,其中 func
与简化形式意义相同。init
与 fini
分别在 lua_processor
构造与析构时调用。
lua_segmentor
提供了 segmentor 的开发接口。它在配置文件中的配置语法有两种,分别是:
engine:
segmentors:
- lua_segmentor@lua_object_name
- lua_segmentor@lua_object_name@name_space
其中 lua_object_name
是 lua 环境中的一个全局对象,可能是一个 lua function 或者一个 lua table。后面的 name_space
当出现时是 segmentor 名字,与 RIME 组件配置中出现的 @
意义一致。
lua_object_name
所指对象有多种形式:
--- 简化形式1
function segmentor(segmentation)
...
end
--- 简化形式2
function segmentor(segmentation, env)
...
end
--- 完整形式
{
init = function (env) ... end,
func = function (segmentation, env) ... end,
fini = function (env) ... end
}
简化形式是 lua function,此函数即为 segmentor 的工作函数。返回值为bool(true: 交由下一个segmentor处理;false: 终止segmentors处理流程)。 参数:
-
segmentation
:Segmentation
对象。 -
env
:lua table 对象。预设engine
和name_space
两个成员,分别是Engine
对象和前述name_space
配置字符串。
完整形式是 lua table,其中 func
与简化形式意义相同。init
与 fini
分别在 lua_segmentor
构造与析构时调用。
librime-lua 封装了 librime C++ 对象到 lua 中供脚本访问。此部分文档待整理。
可通过 env.engine
获得。
属性:
属性名 | 类型 | 解释 |
---|---|---|
schema | ||
context | Context | |
active_engine |
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
process_key | |||
compose | |||
commit_text(text) | text: string | 上屏 text 字符串 | |
apply_schema |
输入编码上下文。
可通过 env.engine.context
获得。
属性:
属性名 | 类型 | 解释 |
---|---|---|
composition | Composition | |
input | string | 正在输入的编码字符串 |
caret_pos | number | 脱字符位置 |
commit_notifier | Notifier | |
select_notifier | Notifier | |
update_notifier | Notifier | |
delete_notifier | Notifier | |
option_update_notifier | OptionUpdateNotifier | 选项改变通知,使用 connect 方法接收通知 |
property_update_notifier | PropertyUpdateNotifier | |
unhandled_key_notifier | KeyEventNotifier |
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
commit | 上屏选中的候选词 | ||
get_commit_text | |||
get_script_text | |||
get_preedit | |||
is_composing | boolean | 是否有未上屏的编码 | |
has_menu | boolean | 是否有候选词(选项菜单) | |
get_selected_candidate | Candidate | 返回选中的候选词 | |
push_input(text) | text: string | 插入指定的text编码字符串 | |
pop_input(num) | num: number | boolean | 删除num指定数量的编码字符串 |
delete_input | |||
clear | 清空正在输入的编码字符串 | ||
select | |||
confirm_current_selection | |||
delete_current_selection | |||
confirm_previous_selection | |||
reopen_previous_selection | |||
clear_previous_segment | |||
reopen_previous_segment | |||
clear_non_confirmed_composition | |||
refresh_non_confirmed_composition | |||
set_option | |||
get_option | |||
set_property | |||
get_property | |||
clear_transient_options |
上下文组成的“作品”。(通过此对象,可间接获得“菜单menu”、“候选词candidate”、“片段segment”相关信息)
可通过 env.engine.context.composition
获得。
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
empty | boolean | 是否有候选词(是否有menu) | |
back | Segment | 获得 Segment 对象 | |
pop_back | |||
push_back | |||
has_finished_composition | |||
get_prompt | string | 获得 Segment 的 prompt 字符串(prompt 为活动编码左边的字符串提示) | |
toSegmentation |
e.g.
local composition = env.engine.context.composition
if(not composition:empty()) then
-- 获得 Segment 对象
local segment = composition:back()
-- 获得选中的候选词下标
local selected_candidate_index = segment.selected_index
-- 获取 Menu 对象
local menu = segment.menu
-- 获得(已加载)候选词数量
local loaded_candidate_count = menu:candidate_count()
end
方案。可以通过 env.engine.schema
获得。
属性:
属性名 | 类型 | 解释 |
---|---|---|
schema_id | string | 方案编号 |
schema_name | string | 方案名称 |
config | Config | 方案配置 |
page_size | number | 每页候选词数 |
select_keys |
方法:
方法名 | 参数 | 返回值 | 解释 |
---|
(方案的)配置。可以通过 env.engine.schema.config
获得
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
load_from_file | |||
save_to_file | |||
is_null(conf_path) | conf_path: string | ||
is_value | |||
is_list(conf_path) | conf_path: string | boolean | 1. 存在且为 ConfigList 返回 true 2. 存在且不为 ConfigList 返回 false 3. 不存在返回 true |
is_map | |||
get_bool | |||
get_int | |||
get_double | |||
get_string(conf_path) | conf_path: string | string | 根据配置路径 conf_path 获取配置的字符串值 |
set_bool | |||
set_int | |||
set_double | |||
set_string | |||
get_item | |||
set_item | |||
get_value | |||
get_list(conf_path) | conf_path: string | ConfigList | 不存在或不为 ConfigList 时返回 nil |
get_map(conf_path) | conf_path: string | ConfigMap | 不存在或不为 ConfigMap 时返回 nil |
set_value | |||
set_list | |||
set_map | |||
get_list_size |
属性:
属性名 | 类型 | 解释 |
---|---|---|
size | number | |
type | string | 如:“kMap” |
element |
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
set | |||
get(key) | key: string | ConfigItem | |
get_value(key) | key: string | ConfigValue | |
has_key | boolean | ||
clear | |||
empty | boolean | ||
keys | table |
属性:
属性名 | 类型 | 解释 |
---|---|---|
size | number | |
type | string | 如:“kList” |
element |
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
get_at(index) | index: number (下标从0开始) |
ConfigItem | |
get_value_at(index) | index: number (下标从0开始) |
ConfigValue | |
set_at | |||
append | |||
insert | |||
clear | |||
empty | |||
resize |
属性:
属性名 | 类型 | 解释 |
---|---|---|
value | string | |
type | string | 如:“kScalar” |
element |
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
get_bool | |||
get_int | |||
get_double | |||
set_bool | |||
set_int | |||
set_double | |||
get_string | |||
set_string |
属性:
属性名 | 类型 | 解释 |
---|---|---|
type | string | 1. "kNull" 2. "kScalar" 3. "kList" 4. "kMap" |
empty |
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
get_value | 当 type == "kScalar" 时使用 | ||
get_list | 当 type == "kList" 时使用 | ||
get_map | 当 type == "kMap" 时使用 |
按键事件对象。
当按键被按下、释放(release)、保持时均会产生按键事件(KeyEvent),触发 processor,此时 KeyEvent 会被作为第一个参数传递给已注册的 lua_processor。
属性:
属性名 | 类型 | 解释 |
---|---|---|
keycode | number | 按键值 |
modifier |
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
shift | boolean | 触发事件时,是否被按压 | |
ctrl | boolean | 触发事件时,是否被按压 | |
alt | boolean | 触发事件时,是否被按压 | |
caps (CapsLk) |
boolean | ||
super | boolean | ||
release | boolean | 当事件为“release”时为 true,否则为 false | |
repr (representation) |
string | 当非 release 时,为按键字符,如:“1”、“a”、“space”、“Shift_L” 当 release 时,为Releas+按键字符,如:“Release+space” |
|
eq(key) (equal) |
key: KeyEvent | boolean | 两个 KeyEvent 是否“相等” |
lt(key) (less than) |
key: KeyEvent | boolean | 对象小于参数时为 true |
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
parse | |||
repr | |||
toKeyEvent |
候选词
构造方法:Candidate(type, start, end, quality)
- type: 标识
- start: 分词开始
- end: 分词结束
- quality: 权重
属性:
属性名 | 类型 | 解释 |
---|---|---|
type | string | 候选词来源标记,如:“user_phrase”、“phrase”、“punct”、“simplified” 1. "user_phrase": 用户字典(随用户输入而更新) 2. "phrase" 3. "punct": 来源有两 "engine/segmentors/punct_segmentor" 或 "symbols:/patch/recognizer/patterns/punct" 4. "simplified" 5. ... |
start | number | |
_start | number | 编码开始位置,如:“好” 在 “ni hao” 中的 _start=2 |
_end | number | 编码结束位置,如:“好” 在 “ni hao” 中的 _end=5 |
quality | number | 结果展示排名权重 |
text | string | 候选词内容 |
comment | string | |
preedit | string | 得到当前候选词的编码 |
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
get_dynamic_type | string | 1. "Phrase": Phrase 2. "Simple": SimpleCandidate 3. "Shadow": ShadowCandidate 4. "Uniquified": UniquifiedCandidate 5. "Other" |
|
get_genuine | |||
get_genuines | |||
to_shadow_candidate | |||
to_uniquified_candidate | |||
append |
https://github.com/hchunhui/librime-lua/pull/162
ShadowCandidate(cand,type,text,comment)類似 simplifier 的作法
构造方法:ShadowCandidate(cand, type, text, comment, inherit_comment)
- cand
- type
- text
- comment
- inherit_comment: (可选)
https://github.com/hchunhui/librime-lua/pull/162
UniqifiedCandidate(cand,type,text,comment) 類似 uniqifier 的作法
在分词处理流程 Segmentor 中存储 Segment 并把其传递给 Translator 进行下一步翻译处理。
作为第一个参数传入以注册的 lua_segmentor。
librime 定义 - https://github.com/rime/librime/blob/5c36fb74ccdff8c91ac47b1c221bd7e559ae9688/src/segmentation.cc#L28
属性:
属性名 | 类型 | 解释 |
---|---|---|
input | string | 活动中的原始(未preedit)输入编码 |
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
empty | boolean | 是否包含 Segment | |
back | Segment | 查看添加的 Segment | |
pop_back | Segment | 查看最近添加的 Segment,并将其从 Segmentation 中移除 | |
reset_length | |||
add_segment(seg) | seg: Segment | 添加 Segment (librime v1.7.3:如果已包含 Segment,仅将新 Segment.tags 合并入旧 Segment.tags) |
|
forward | |||
trim | 清空其中的 Segment | ||
has_finished_segmentation | boolean | ||
get_current_start_position | number | ||
get_current_end_position | number | ||
get_current_segment_length | number | ||
get_confirmed_position | number | 属性 input 中已经确认(处理完)的长度 (通过判断 status 为 "kSelected" 以上的 Segment 的 _end 来判断 confirmed_position) https://github.com/rime/librime/blob/cea389e6eb5e90f5cd5b9ca1c6aae7a035756405/src/segmentation.cc#L127 |
e.g.
| 你hao‸a
env.engine.context.input | "nihaoa"
Segmentation.input | "nihao"
get_confirmed_position | 2
分词片段。触发 translator 时作为第二个参数传递给注册好的 lua_translator。
构造方法:Segment(start_pos, end_pos)
- start_pos: 开始下标
- end_pos: 结束下标
属性:
属性名 | 类型 | 解释 |
---|---|---|
status | string | 1. kVoid - (默认) 2. kGuess 3. kSelected - 大于此状态才会被视为选中 4. kConfirmed
|
start | ||
_start | ||
_end | ||
length | ||
tags | Set | 标签 |
menu | ||
selected_index | ||
prompt | string | 输入编码旁的提示字符串 |
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
clear | |||
close | |||
reopen | |||
has_tag | |||
get_candidate_at | |||
get_selected_candidate |
构造方法:Set(table)
- table: 列表
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
empty | |||
__index | |||
__add | |||
__sub | |||
__mul | |||
__set |
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
add_translation | |||
prepare | |||
get_candidate_at | |||
candidate_count | |||
empty |
反查
构造方法:ReverseDb(file_name)
- file_name: 反查字典文件路径。 如:
build/terra_pinyin.reverse.bin
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
lookup |
构造方法:ReverseLookup(dict_name)
- dict_name: 字典名。 如:
luna_pinyin
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
lookup(key) | string | string | 如:ReverseLookup("luna_pinyin"):lookup( "百" ) == "bai bo"
|
lookup_stems(key) |
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
Processor | 如:Component.Processor(env.engine,"","ascii_composer")
|
||
Segmentor | |||
Translator | |||
Filter |
接收通知
通知类型:
- commit_notifier
- select_notifier
- update_notifier
- delete_notifier
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
connect(func) | func: function |
e.g.
-- ctx: Context
env.engine.context.commit_notifier:connect(function(ctx)
-- your code ...
end)
同 Notifier
e.g.
-- ctx: Context
-- name: string
env.engine.context.option_update_notifier:connect(function(ctx, name)
-- your code ...
end)
同 Notifier
e.g.
-- ctx: Context
-- name: string
env.engine.context.property_update_notifier:connect(function(ctx, name)
-- your code ...
end)
同 Notifier
e.g.
-- ctx: Context
-- key: KeyEvent
env.engine.context.unhandled_key_notifier:connect(function(ctx, key)
-- your code ...
end)
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
disconnect |
记录日志到日志文件
日志位置:https://github.com/rime/home/wiki/RimeWithSchemata#%E9%97%9C%E6%96%BC%E8%AA%BF%E8%A9%A6
- 【中州韻】
/tmp/rime.ibus.*
- 【小狼毫】
%TEMP%\rime.weasel.*
- 【鼠鬚管】
$TMPDIR/rime.squirrel.*
- 各發行版的早期版本
用戶資料夾/rime.log
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
info | |||
warning | |||
error |
属性:
属性名 | 类型 | 解释 |
---|
方法:
方法名 | 参数 | 返回值 | 解释 |
---|---|---|---|
get_rime_version | string | librime 版本 | |
get_shared_data_dir | string | 程序目录\data | |
get_user_data_dir | string | 用户目录 | |
get_sync_dir | string | 用户资料同步目录 | |
get_distribution_name | string | 如:“小狼毫” | |
get_distribution_code_name | string | 如:“Weasel” | |
get_distribution_version | string | 发布版本号 | |
get_user_id |