您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關Java編程如何通過匹配合并數據,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
具體如下。
數據描述
以下程序是對如下格式的數據進行合并處理。
這個表的每一行表示用戶id及用戶的特征。其中,一個用戶只有一個特征向量,即第一列不會重復。
這張表的第一列,表示用戶的id,第二列表示用戶所看的電影,第三列表示用戶對電影的打分(1-13分),第四列表示用戶對電影的打分,但分值范圍是1-5分。
問題描述
在做數據預處理時,如何將第二張表添加上用戶特征呢?其實,方法很簡單,將第二張表的用戶id與第一張表的用戶id進行匹配就行。合并結果如下圖所示。
數據處理程序
package deal; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStreamReader; import java.math.BigDecimal; import java.util.ArrayList; import java.util.HashMap; import java.util.List; /* * author:合肥工業大學 管院學院 錢洋 * email:1563178220@qq.com */ public class GetPUser { public static List<String> readDocs(String docsPath,String code) throws IOException{ BufferedReader reader = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath)),code)); String s=null; List<String> userproductscore=new ArrayList<String>(); while ((s=reader.readLine())!=null) { userproductscore.add(s); } reader.close(); return userproductscore; } public static HashMap<String, String> MAPread(String docsPath2,String code1) throws IOException{ BufferedReader reader1 = new BufferedReader( new InputStreamReader( new FileInputStream( new File(docsPath2)),code1)); String s1=null; HashMap<String,String> userfeaturemap=new HashMap<String,String>(); while ((s1=reader1.readLine())!=null) { String arr[]=s1.split("\t"); String feature=""; for (int i = 1; i < arr.length; i++) { BigDecimal db = new BigDecimal(arr[i]); String ii = db.toPlainString(); feature+=ii+" "; } userfeaturemap.put(s1.split("\t")[0], feature); } reader1.close(); return userfeaturemap; } public static List<String> match(List<String> userproductscore,HashMap<String, String> userfeaturemap) throws IOException{ List<String> userscoreandfeature=new ArrayList<>(); for (int i = 0; i < userproductscore.size(); i++) { //獲取用戶id String user_id=userproductscore.get(i).split("\t")[0]; //獲取用戶特征 String userfeature = userfeaturemap.get(user_id); userscoreandfeature.add(userproductscore.get(i)+"\t"+userfeature); System.out.println(userproductscore.get(i)+"\t"+userfeature); } return userscoreandfeature; } public static void main(String[] args) throws IOException { //讀取兩個文本 List<String> userproductscore=readDocs("data/train/ydata-ymovies-user-movie-ratings-train-v1_0.txt","gbk"); HashMap<String, String> userfeaturemap=MAPread("data/fileofuser/yahoo.txt","utf-8"); //匹配結果 match(userproductscore,userfeaturemap); } }
關于“Java編程如何通過匹配合并數據”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。