91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何在Java中使用pinyin4j將漢字轉為拼音

發布時間:2021-02-24 16:25:37 來源:億速云 閱讀:160 作者:戴恩恩 欄目:編程語言

本文章向大家介紹如何在Java中使用pinyin4j將漢字轉為拼音的基本知識點總結和需要注意事項,具有一定的參考價值,需要的朋友可以參考一下。

Java可以用來干什么

Java主要應用于:1. web開發;2. Android開發;3. 客戶端開發;4. 網頁開發;5. 企業級應用開發;6. Java大數據開發;7.游戲開發等。

一、工具介紹

pinyin4j 是一個支持將簡體和繁體中文轉換到成拼音的Java開源類庫;

1. 功能

  • 支持同一漢字有多個發音

  • 還支持拼音的格式化輸出,比如第幾聲之類的,

  • 同時支持簡體中文、繁體中文轉換為拼音…使用起來也非常簡單。下面是其官方網址,其中提供了下載:

  • pinyin4j的官方下載地址

2. 目錄結構及說明

  • doc : pinyin4j的api文檔

  • lib : pinyin4j的jar包

  • src: pinyin4j的源代碼

  • CHANGELOG.txt : pinyin4j的版本更新日志

  • COPYING.txt : LICENSE說明

  • README.txt : pinyin4j的概要介紹

3. 原理

pinyin4j使用了一個.txt的文本文件(uicode_to_hanyu_pinyin.txt)用來存儲漢字unicode編碼與拼音的對應關系,通過讀取該配置文件達到轉換的目的。

該屬性文件存儲信息的基本格式如下:89E3 (jie3,jie4,xie4) //(對應漢字”解”)89E3 是漢字對應的unicode編碼的16進制數,(jie3,jie4,xie4)是該漢字對應的三種讀音(在漢語里有多音字)

說明pinyin4j支持多音字的處理pinyin4j的處理過程是這樣的:

根據String的toCharArray方法得到每個字符(得到”解”字的unicode編碼,實際上是35299,由于java中char和String都是unicode編碼的可以直接轉為int型的編碼數據35299),然后利用Integer.toHexString(c1).toUpperCase()將其轉換成16進制數[也就是89E3],通過讀取配置文件得到“解”字的拼音(jie3,jie4,xie4),那么這里有三個拼音,pinyin4j的默認取值為第一個,也就是jie3[表示讀jie,聲調是三聲]

二、pinyin4J 使用

pinyin4j 提供的工具類為PinyinHelper,里邊提供了靜態方法

- toHanyuPinyinString()(過時)

- toHanyuPinyinStringArray()

pinyin4j 中有四個輔助類分別是:

- HanyuPinyinCaseType

- HanyuPinyinToneType

- HanyuPinyinVCharType

- HanyuPinyinOutputFormat

具體功能和用法見一下代碼:

HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 控制大小寫
// UPPERCASE:大寫 (ZHONG)
// LOWERCASE:小寫 (zhong)
defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
// WITHOUT_TONE:無音標 (zhong)
// WITH_TONE_NUMBER:1-4數字表示英標 (zhong4)
// WITH_TONE_MARK:直接用音標符(必須WITH_U_UNICODE否則異常) (zhòng)
defaultFormat.setToneType(HanyuPinyinToneType.WITH_TONE_NUMBER);
// WITH_V:用v表示ü (nv)
// WITH_U_AND_COLON:用"u:"表示ü (nu:)
// WITH_U_UNICODE:直接用ü (nü)
defaultFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
// oHanyuPinyinStringArray如果傳入的字符不是漢字不能轉換成拼音,那么會直接返回null。
String[] pinyin = PinyinHelper.toHanyuPinyinStringArray('重', defaultFormat);
for(String str: pinyin){
  System.out.println(str);
}

結果:

ZHONG4

CHONG2

其他工具類

獲取獲得漢語拼音首字母

將字符串中的中文轉化為拼音,英文字符不變

/**
 * 獲得漢語拼音首字母
 *
 * @param chines
 *      漢字
 * @return
 */
public static String getAlpha(String chines) {
  String pinyinName = "";
  char[] nameChar = chines.toCharArray();
  HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
  defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
  defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
  for (int i = 0; i < nameChar.length; i++) {
    if (nameChar[i] > 128) {
      try {
        pinyinName += PinyinHelper.toHanyuPinyinStringArray(
            nameChar[i], defaultFormat)[0].charAt(0);
      } catch (BadHanyuPinyinOutputFormatCombination e) {
        e.printStackTrace();
      }
    } else {
      pinyinName += nameChar[i];
    }
  }
  return pinyinName;
}

/**
 * 將字符串中的中文轉化為拼音,英文字符不變
 *
 * @param inputString
 *      漢字
 * @return
 */
public static String getPingYin(String inputString) {
  HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
  format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
  format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
  format.setVCharType(HanyuPinyinVCharType.WITH_V);
  String output = "";
  if (inputString != null && inputString.length() > 0
      && !"null".equals(inputString)) {
    char[] input = inputString.trim().toCharArray();
    try {
      for (int i = 0; i < input.length; i++) {
        if (java.lang.Character.toString(input[i]).matches(
            "[\\u4E00-\\u9FA5]+")) {
          String[] temp = PinyinHelper.toHanyuPinyinStringArray(
              input[i], format);
          output += temp[0];
        } else
          output += java.lang.Character.toString(input[i]);
      }
    } catch (BadHanyuPinyinOutputFormatCombination e) {
      e.printStackTrace();
    }
  } else {
    return "*";
  }
  return output;
}

/**
 * 漢字轉換為漢語拼音首字母,英文字符不變
 *
 * @param chines
 *      漢字
 * @return 拼音
 */
public static String converterToFirstSpell(String chines) {
  String pinyinName = "";
  char[] nameChar = chines.toCharArray();
  HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
  defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
  defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
  for (int i = 0; i < nameChar.length; i++) {
    if (nameChar[i] > 128) {
      try {
        pinyinName += PinyinHelper.toHanyuPinyinStringArray(
            nameChar[i], defaultFormat)[0].charAt(0);
      } catch (BadHanyuPinyinOutputFormatCombination e) {
        e.printStackTrace();
      }
    } else {
      pinyinName += nameChar[i];
    }
  }
  return pinyinName;
}

以上就是小編為大家帶來的如何在Java中使用pinyin4j將漢字轉為拼音的全部內容了,希望大家多多支持億速云!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

竹北市| 武功县| 天门市| 宜宾市| 林西县| 林甸县| 霍州市| 达日县| 新宁县| 偏关县| 荔波县| 惠安县| 城固县| 双鸭山市| 巩留县| 华宁县| 海宁市| 大荔县| 昆山市| 江北区| 外汇| 农安县| 公主岭市| 开远市| 凯里市| 宝鸡市| 新宾| 民丰县| 藁城市| 二手房| 耿马| 张北县| 城固县| 新津县| 安福县| 新巴尔虎右旗| 平湖市| 同仁县| 永善县| 庐江县| 安多县|