macOS 使用 enca 识别 文件编码类型(比 file 命令准确)

文章目录

    • macOS 上安装 enca
    • 基本使用
    • 起因 - iconv
    • 关于 enca
    • 安装 Enca
    • enca & enconv 其它用法


macOS 上安装 enca

brew install enca

基本使用

enca filepath.txt

示例

$ enca 动态规划算法.txt       [0]
Simplified Chinese National Standard; GB2312CRLF line terminators

起因 - iconv

在macOS 上打开一些 .txt 文件,会显示乱码(非 utf-8 编码),我想使用 iconv 命令对文件进行转码。
此时使用 file 命令来获得文件编码,在使用 iconv 转码时会出错。使用 enca 获取的则正确。

副 iconv 转码命令:

iconv  -f GB2312   -t UTF-8  分治算法.txt > 分治算法2.txt 

iconv 使用可详见:https://ezcode.blog.csdn.net/article/details/146444439


关于 enca

如果解决问题之余,还想更多了解 enca 可以往下看。

enca github : https://github.com/nijel/enca

Enca : Extremely Naive Charset Analyser,极简的字符集分析器

由两个主要组件组成:

  • libenca,一个编码检测库。
    它目前支持白俄罗斯语、保加利亚语、克罗地亚语、捷克语、爱沙尼亚语、匈牙利语、拉脱维亚语、立陶宛语、波兰语、俄语、斯洛伐克语、斯洛文尼亚语、乌克兰语、中文以及一些独立于语言的多字节编码。
    API 应该相对稳定(可以理解为“它要么只发生微小的变化,要么发生非常剧烈的变化”)。
  • enca,一个命令行前端,集成了 libenca 和几个字符集转换库和工具(GNU recode、UNIX98 iconv、perl Unicode::Map、cstocs)。

安装 Enca

Enca 应该可以在每个符合 POSIX.1 规范的系统上使用 ISO C 编译器编译并运行,实际上它也可以在许多不符合规范的系统上编译(下面列出依赖项)。

如果您拥有以下附加工具,Enca 可以使用它们作为外部转换器:

  • GNU recode 和相关的编码库
  • Perl 字符集转换器 Unicode::Map8 或 Unicode::Map
  • cstocs,著名的捷克字符集转换器

可选功能:

  • GNU recode 库接口的编译由 --with-librecode[=DIR]--without-librecode 配置参数控制。
    默认情况下,如果找到它则会编译进去。您还可以指定一个文件夹;librecode 包含文件将在此 DIR/include 中搜索,库本身在 DIR/lib 中。
  • UNIX98 iconv 接口的编译由 --with-libiconv=[DIR]--without-libiconv 配置参数控制。
    默认情况下,如果找到并且被认为可用则会编译进去。您还可以指定一个 DIR;libiconv 包含文件将在此 DIR/include 中搜索,库本身在 DIR/lib 中。
  • 外部转换程序接口的编译由 --enable-external--disable-external 配置参数控制。默认情况下是编译进去的。

不要尝试在以下不支持 ISO C 和 POSIX 功能的系统上编译 Enca:

  • 函数原型。
  • 基本的 ISO C 头文件及其声明的函数:
    • assert.h, ctype.h, math.h, stdarg.h, stdio.h, stdlib.h
    • 任意(工作状态)的 string.h, strings.h, memory.h
    • unistd.h, sys/stat.h, sys/types.h

对于有耐心的人:像往常一样运行以下命令

./configure
make
make check
make install

enca & enconv 其它用法


输入 enca --help 可以查看可用选项

也可以输入 man enca 获得更多说明

 $ enca --help                                                                                                   [0]
Usage:  enca [-L LANGUAGE] [OPTION]... [FILE]...enconv [-L LANGUAGE] [OPTION]... [FILE]...
Detect encoding of text files and convert them if required.Operation modes:-g, --guess             Behave as `enca' (just detect encoding by default)-c, --auto-convert      Behave as `enconv' (autoconvert by default)Output type selectors:-d, --details           Print failure reason when encoding was not recognized-e, --enca-name         Print enca's encoding name (passed to converters)-f, --human-readable    Print full (descriptive) encoding name (default)-i, --iconv-name        Print how iconv calls the encoding-m, --mime-name         Print preferred MIME encoding name-r, --rfc1345-name      Print RFC 1345 (or otherwise canonized) encoding name-s, --cstocs-name       Print how cstocs calls the encoding-n, --name=WORD         Print required name (enca-name, human-readable, etc.)-x, --convert-to=ENC    Convert file to some other encoding ENCGuessing parameters:-L, --language=LANG     Set language of FILEs; obligatory, when cannot bedetermined from locale settingsConversion parameters:-E, --external-converter-program=PATHSet external converter program name(default: piconv)-C, --try-converters=LIST  Converters to be tried (associative)(default: built-in,iconv)General options:-p, --with-filename     Print the file name for each result-P, --no-filename       Suppress the prefixing filename on output-V, --verbose           Increase verbosity levelListings:-G, --license           Print full enca license and terminate-h, --help              Print this help and terminate-l, --list=WORD         Print required list (built-in-charsets, converters,charsets, languages, lists, names, surfaces)and terminate-v, --version           Print version and build information and terminateWith no FILE, reads standard input and possibly writes converted stream to
standard output.  Exit status is 0 if all files were successfully proceeded,
1 if some were not recognized or converted, 2 in real troubles.When called as `enconv' without -x, target encoding it guessed from locales.Report bugs to https://github.com/nijel/enca/issues

2025-03-22(六)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/74307.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

线段树与扫描线 —— 详解算法思想及其C++实现

目录 一、线段树(Segment Tree) 基本概念 结构 操作 示例代码 二、扫描线(Sweep Line) 基本概念 应用场景 示例代码(矩形面积并集) 三、总结 一、线段树(Segment Tree) 基本…

汇编代码中嵌入回调函数的优化说明

一、概述 在 PowerPC 的汇编代码中,我们需要实现调用 C 函数(例如回调函数),并传递参数。本文将详细介绍如何通过一系列步骤完成这一目标,包括代码示例和详细的注释。 二、调用 C 函数的基本步骤及代码 1. 保存工作寄…

Uni-App 双栏联动滚动组件开发详解 (电梯导航)

本文基于提供的代码实现一个左右联动的滚动组件&#xff0c;以下是详细的代码解析与实现原理说明&#xff1a; <!--双栏联动滚动组件 - 技术解析功能特性&#xff1a;1. 左侧导航栏与右侧内容区双向联动2. 自适应容器高度3. 平滑滚动定位4. 动态内容位置计算 --> <te…

软考复习-传输介质与编码

传输介质 双绞线 传输距离100一200m&#xff0c;即网线&#xff0c;有多种分类 UTP非屏蔽双绞线 STP屏蔽双绞线 线序标准有两种为&#xff1a; T568A标准&#xff1a;绿白、绿、橙白、蓝、蓝白、橙、棕白、棕 T568B标准&#xff1a;橙白、橙、绿白、蓝、蓝白、绿、棕白、…

论文阅读笔记:Denoising Diffusion Probabilistic Models (3)

论文阅读笔记&#xff1a;Denoising Diffusion Probabilistic Models (1) 论文阅读笔记&#xff1a;Denoising Diffusion Probabilistic Models (2) 论文阅读笔记&#xff1a;Denoising Diffusion Probabilistic Models (3) 4、损失函数逐项分析 可以看出 L L L总共分为了3项…

PyTorch 面试题及参考答案(精选100道)

目录 PyTorch 的动态计算图与 TensorFlow 的静态计算图有何区别?动态图的优势是什么? 解释张量(Tensor)与 NumPy 数组的异同,为何 PyTorch 选择张量作为核心数据结构? 什么是 torch.autograd 模块?它在反向传播中的作用是什么? 如何理解 PyTorch 中的 nn.Module 类?…

#C8# UVM中的factory机制 #S8.1.4# 约束的重载

今天,复习一下《UVM实战》一书中的 关于约束的重载 章节学习。 一 问题引导 文件:src/ch8/section8.1/8.1.2/rand_mode/my_transaction.sv4 class my_transaction extends uvm_sequence_item; …17 constraint crc_err_cons{18 crc_err == 1b0;19 }20 const…

空调遥控器低功耗单片机方案

RAMSUN空调遥控器采用先进的32位低功耗单片机作为核心控制器&#xff0c;通过优化软件算法和硬件设计&#xff0c;实现了空调遥控器的低功耗运行。单片机集成了多种功能模块&#xff0c;包括红外发射、按键扫描、电源管理等&#xff0c;有效降低了整体功耗。同时&#xff0c;该…

结构型——代理模式

结构型——代理模式 代理模式指的是通过创建一个代理来控制对原始对象的访问。代理在客户端与实际对象之间充当“中介” 特点 访问控制&#xff1a;代理对象可以控制对实际对象的访问&#xff0c;从而实现对访问权限的控制。延迟加载&#xff1a;代理对象可以在实际对象被调…

【算法】常见排序算法(插入排序、选择排序、交换排序和归并排序)

文章目录 前言一、排序概念及常见排序算法框图1.排序概念2.常见排序算法框图 二、实现比较排序算法1.插入排序1.1 直接插入排序1.2 希尔排序 2.选择排序2.1 直接选择排序2.2 堆排序 3.交换排序3.1 冒泡排序3.2 快速排序3.2.1 hoare版本3.2.2 挖坑法3.2.3 lomuto前后指针 3.3 快…

Go语言分布式锁实战:dlock助力构建高并发稳定系统

在构建分布式系统时&#xff0c;一个常见且棘手的问题便是资源竞争和数据一致性问题。分布式锁作为一种常用的解决方案&#xff0c;在多个进程或节点之间协调访问共享资源时显得尤为重要。今天&#xff0c;我们将介绍一款分布式锁库——dlock&#xff0c;并通过详细的使用示例带…

算法方法快速回顾

&#xff08;待修改&#xff09; 目录 1. 双指针2. 滑动窗口理论基础 3. 二分查找3. 二分查找理论基础 4. KMP5. 回溯算法6. 贪心算法7. 动态规划7.1. 01背包7.2. 完全背包7.3. 多重背包 8. 单调栈9. 并查集10. 图论10.1. 广度优先搜索&#xff08;BFS&#xff09;10.2. 深度优…

深度学习:让机器学会“思考”的魔法

文章目录 引言&#xff1a;从“鹦鹉学舌”到“举一反三”一、深度学习是什么&#xff1f;1. 定义&#xff1a;机器的“大脑”2. 核心思想&#xff1a;从数据中“悟”出规律 二、深度学习的“大脑”结构&#xff1a;神经网络1. 神经元&#xff1a;深度学习的基本单元2. 神经网络…

电动自行车/电动工具锂电池PCM方案--SH367003、SH367004、SH79F329

在消费电子系统中&#xff0c;如手机电池包&#xff0c;笔记本电脑电池包等&#xff0c;带有控制IC、功率MOSFETFE管以及其他电子元件的电路系统称为电池充放电保护板Protection Circuit Module &#xff08;PCM&#xff09;&#xff0c;而对于动力电池的电池管理系统&#xff…

补码详细分析

补码引入 举一个生活化的例子 假设由一个挂钟&#xff0c;它只能顺时钟调时间&#xff0c;那么它调时间就分成了一下两种情况 正好顺时针调就能调好 如&#xff1a;时针从5调到9需要逆时针调才能调好 如&#xff1a;时针从10调到7 在上面的情况中1是不用处理的&#xff0c;2…

计算机网络入门:物理层与数据链路层详解

&#x1f310; &#xff08;专业解析 中学生也能懂&#xff01;&#xff09; &#x1f4d6; 前言 计算机网络就像数字世界的“高速公路系统”&#xff0c;而物理层和数据链路层是这条公路的基石。本文用 专业视角 和 生活化比喻 &#xff0c;带你轻松理解这两层的核心原理&a…

哪些视频格式在webview2中播放可以设置成透明的?

在WebView2中&#xff0c;能够播放并设置成透明背景的视频格式主要取决于其支持的编解码器以及视频是否包含alpha通道&#xff08;透明度信息&#xff09;。以下是支持透明背景的视频格式&#xff1a; 支持透明背景的视频格式 1. WebM&#xff08;使用VP9编解码器&#xff09; …

【基于ROS的A*算法实现路径规划】A* | ROS | 路径规划 | Python

### 记录一下使用Python实现ROS平台A*算法路径规划 ### 代码可自取 &#xff1a;Xz/little_projecthttps://gitee.com/Xz_zh/little_project.git 目录 一、思路分析 二、算法实现 三、路径规划实现 一、思路分析 要求使用A*算法实现路径规划&#xff0c;可以将该任务分为三…

2025-03-23 吴恩达机器学习3——多维特征

文章目录 1 多元引入2 矢量化2.1 示例2.2 非矢量化实现2.3 矢量化实现2.4 应用 3 特征缩放3.1 举例3.2 必要性3.3 方法3.3.1 最大最小值缩放&#xff08;Min-Max Scaling&#xff09;3.3.2 均值归一化&#xff08;Mean Normalization&#xff09;3.3.3 Z 分数归一化&#xff08…

正点原子内存管理学习和修改

由于项目需要用到内存管理进行动态申请和释放&#xff0c;今天又重新学习了一下正点原子的内存管理实验&#xff0c;温习了一下内存管理的实质。首先先上正点原子内存管理的源代码&#xff1a; malloc.c文件&#xff1a; #include "./MALLOC/malloc.h"#if !(__ARMC…