您好,登錄后才能下訂單哦!
怎么使用python實現文本數據挖掘?這個問題可能是我們日常學習或工作經常見到的。希望通過這個問題能讓你收獲頗深。下面是小編給大家帶來的參考內容,讓我們一起來看看吧!
常見的文本挖掘有以下方式:
1、讀取txt數據
In [1]: import pandas as pd In [2]: mydata_txt = pd.read_csv('C:\\test_code.txt',sep = '\t',encoding = 'utf-8')
2、讀取csv數據
csv文本文件是非常常用的一種數據存儲格式,而且其存儲量要比Excel電子表格大很多,下面我們就來看看如何利用Python讀取csv格式的數據文件:
In [5]: mydata_csv = pd.read_csv('C:\\test.csv',sep = ',',encoding = 'utf-8') In [6]: mydata_csv
3、讀取電子表格文件
這里所說的電子表格就是Excel表格,可以是xls的電子表格,也可以是xlsx的電子表格。在日常工作中,很多數據都是存放在Excel電子表格中的,如果我們需要使用Python對其進行分析或處理的話,第一步就是如何讀取Excel數據。下面我們來看看如果讀取Excel數據集:
In [7]: mydata_excel = pd.read_excel('C:\\test.xlsx',sep = '\t',encoding = 'utf-8') In [8]: mydata_excel
4、讀取數據庫數據
MySQLdb模塊是一個連接Python與MySQL的中間橋梁,但目前只能在Python2.x中運行,但不意味著Python3就無法連接MySQL數據庫。這里向大家介紹一個非常靈活而強大的模塊,那就是pymysql模塊。我比較喜歡他的原因是,該模塊可以偽裝成MySQLdb模塊,具體看下面的例子:
In [1]: import pymysql In [2]: pymysql.install_as_MySQLdb() #偽裝為MySQLdb模塊 In [3]: import MySQLdb使用Connection函數聯通Python與MySQL In [4]: conn = MySQLdb.Connection( ...: host = 'localhost', ...: user = 'root', ...: password = 'snake', ...: port = 3306, ...: database = 'test', ...: charset='gbk')使用conn的游標方法(cursor),目的是為接下來的數據庫操作做鋪墊。 In [5]: cursor = conn.cursor() In [6]: sql = 'select * from memberinfo'執行SQL語句 In [7]: cursor.execute(sql)Out[7]: 4 In [8]: data = cursor.fetchall() In [9]: data
感謝各位的閱讀!看完上述內容,你們對怎么使用python實現文本數據挖掘大概了解了嗎?希望文章內容對大家有所幫助。如果想了解更多相關文章內容,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。