一个万古常青的、小而美的输入法

news/2025/11/2 21:05:51/文章来源:https://www.cnblogs.com/funwithwords/p/19185425

万古常青

  • apt install fcitx-sunpinyin 即可安装。Ubuntu和Debian不倒,就一直有。

  • 系统词库为libgooglepinyin和sunpinyin的合并去重版,词比它们都多。
  • 用sunpinyin训练了字的三元语法模型:Total 3 level ngram: 5682 226342 360548,号称592572词。
  • 训练语料为1.6G的百科问答,既包罗万象,又贴近口语。

  • 5.8M lm_sc.t3g; 2.6M pydict_sc.bin,约为sunpinyin自带数据的1/7。压缩后4.2M〔下载

安装

  • 先装sunpinyin,再覆盖它的数据。

用户词典

  • 用户词典为~/.sunpinyin/userdict,是个sqlite数据库,包里有程序可飞速加词。用sqlite可导出编辑词库。

开发过程与细节

  • https://www.cnblogs.com/funwithwords/p/19182113
  • https://www.cnblogs.com/funwithwords/p/19185218

常青

  • 我在写这篇文章时,就像在和亲爱的读者您交谈一样:-),脑海浮现出的是读音,不是一串汉字。字形输入法属于过去的专业打字员,面对稿件,见字输字,不读,不想。
  • 在办公室里对着麦克风说“亲爱的读者们?”
  • 脑电波?好吧,“常青到我死为止”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/953802.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

开始学深度学习!

开始学深度学习!

LLaMA-Factory

LLaMA-Factory Used by Amazon, NVIDIA, Aliyun, etc.Supporters ❤️Warp, the agentic terminal for developersAvailable for MacOS, Linux, & WindowsEasily fine-tune 100+ large language models with zero-…

守护线程--daemon

线程可以分为用户线程与守护线程,虚拟机必须等待用户线程执行完毕但不用等待守护线程执行完毕 守护线程如:垃圾回收机制, 内存监控等 守护线程顾名思义,用于守护用户线程,下面举例介绍 public class Daemon {publ…

换一个思维解决问题:希望在转角

前段时间困扰我的一个网络拦截请求的问题,终于被巧妙地解决了。 我之前开发了一个net proxy,专门用于对特殊网络环境的模拟,以此测试一个工作中需要测试的软件。简单来说就是用mitmproxy实现一个网络流量代理服务,…

条件表达式中的赋值问题

条件表达式中的赋值问题在条件表达式中(如while、if语句的条件部分),不允许直接进行变量初始化并同时使用该变量进行比较。C++语法规则禁止在条件判断中同时进行变量声明和比较操作。 int numJewelsInStones(string…

csp2025 总结

T1T2 没有什么失误,大概 40min 的时候过了。 T3 之前做过 https://uoj.ac/problem/772 (但其实纯粹是误导),当时就忘记了复杂度分析依赖贡献一起处理(虚树)后来改了,场上就把虚树这个环节忘了,大样例很水所以过…

CSP 总结

J 前两题写得比较快,20min 左右过了。 T3 一开始看错了,以为区间可以重叠,手动模拟了一下样例发现不对,重读了一遍题,大概在 40min 时过了大样例。 感觉手感火热,遂开 T4,发现直接统计和大于 \(l_i\) 的不太好做…

2025 CSP

考虑自己的考场策略是否正确T1T2只用了40分种,问题在于T3的时间分配过多,但是我认为这是比较正确的因为在T1T2是签到题的情况下,以及T4基本不可能想出正解的情况下,去想一个自己已经有50分暴力分思路的T3是一个比较…

Jenkins-CICD项目自动化部署

1.环境准备主机名 IP 配置dev 192.168.233.146 2G C1project_master 192.168.233.154 3G,2C1project_slave 192.168.233.155 3G,2C1auto_deployment 192.168.233.156 5G,2C12.初始化环境 四台都做 #1.修改主机名 hostn…

使用Stream API重构你的数据处理

如果你还在使用繁琐的for循环和临时集合来处理数据,是时候了解Java 8引入的Stream API了。它让数据处理变得声明式、可组合,并且更加优雅。 什么是Stream? Stream不是数据结构,而是对数据源(集合、数组等)的元素…

js实现页面弹框,每天没个浏览器只在第一次访问会有弹框

js实现页面弹框,每天没个浏览器只在第一次访问会有弹框localStorage.getItem方法<script type="text/javascript">function GetDateStr(AddDayCount) {var dd = new Date();dd.setDate(dd.getDate()+…

[省选联考]追忆——题目背景美化

\[\textrm{\textit{\textbf{\large \textcolor{#8b5cf6}{我常常}\textcolor{#6366f1}{追忆}\textcolor{#0ea5e9}{过去。}}}} \]\[\textstyle \mathcal {\small {^{\frac{\textrm{\textit{\textbf{\textcolor{#f472b6}{…

多线程封装

//Thread.hpp #pragma once #include<iostream> #include<string> #include<cstring> #include<functional> #include<unistd.h> #include<cassert> #include<pthread.h> c…

使用 GeckoCircuits 设计 Buck 电源环路

使用 GeckoCircuits 设计 Buck 电源环路使用 GeckoCircuits 设计 Buck 电源环路 笔者最近发现一款开源的电力电子仿真软件 GeckoCircuits,它是由苏黎世联邦理工学院(ETH)开发的,具有极高的仿真速度,软件小巧,功能…

第k小的数的分治算法

include using namespace std; int x=100; int rr(int b[],int left,int right) { int m=left,n=right+1; int h=b[left]; while(1) { while(b[++m]<h&&m<right); while(b[--n]>h); if(m>=n) { br…

Day29-C:\Users\Lenovo\Desktop\note\code\JavaSE\Basic\src\com\reflect

单元测试 Junit单元测试框架package Basic.src.com.Junit;public class StringUtil {public static void printNumber(String name) {if (name == null) {System.out.println(0);return;//停掉方法}System.out.println…

k8s-Pod中的网络通信(3)

部署的pod都会涉及到和内外网络通信,我们部署的pod 有一个ip,这个IP 是集群内部的IP ,只能在集群内被访问,k8s中pod的网路通信是交给service来管理的,简称svc。负责将外部流量引入,和内部流量引出。 1.外部流量访…

一个灵感:思维的断章

一个灵感:思维的断章 它来时,没有预兆。 不是在逻辑的链条上规行矩步,也不是在记忆的仓库里按图索骥。它诞生于一片更为辽阔、更为混沌的模糊空间。 那片空间,是意识的背景辐射,是思想形成之前的星云。那里,概念…

第十届中国大学生程序设计竞赛 哈尔滨站(CCPC 2024 Harbin Site)

第十届中国大学生程序设计竞赛 哈尔滨站(CCPC 2024 Harbin Site)比赛链接 Review 因为下周就要“一起哈啤”,所以这周末来 VP 去年的“一起哈啤”,然而已经一个多月没写代码了! 开题顺序依旧,看了个 J 感觉还挺可…

CSP-S 回顾

开考后发现自己穿了一个绒秋裤,考场上要被热死了,不断通过喝水降低体温。 $1min$ 第一题一下想到$DP和反悔贪心$,还好学了(汗) $1min 1s$否决掉了$DP$ $20min$ 奶龙考试时遇到了一些问题: 优先队列pair<int,p…