国产aV无码片毛片一级韩国,午夜草草视频在线播放,中国人妻少妇精品一区二区,在线视频播放一区二区三区,一区二区三区久久av,日韩人妻系列中文字幕,国产av综合av亚洲av,欧美多人啊啊啊啊污污视频,国产大鸡巴插女生b视频

教育裝備采購網(wǎng)
第八屆圖書館論壇 校體購2

【軟件更新】WordStat 2022 新功能新特性

教育裝備采購網(wǎng) 2023-03-14 13:14 圍觀427次

  WordStat 2022 版有哪些新功能?

  我們很高興推出 WordStat 2022。從 WordStat 9 到新版本 WordStat 2022(以及新版本號方案)意味著更快地引入每年發(fā)布一次的新功能,而不是每 2 或 3 年發(fā)布一次,并且很可能甚至每年不止一次。

  新的 WordStat 2022 實(shí)現(xiàn)了幾個重要的功能,雖然沒有以前的主要版本那么多,但我們認(rèn)為它們具有重要意義,特別是對于開發(fā)分類模型、分類法或詞典。

  1. 高度優(yōu)化的主題建模與因素分析

  在 WordStat 2022 中,我們實(shí)施了一個新的多線程因素分析例程,比以前的版本快 65 倍。這意味著現(xiàn)在可以在不到一分鐘的時間內(nèi)解決需要一個小時計(jì)算的大型問題。我們還能夠?qū)⒁蛩胤治鋈萘吭黾拥?10,000 個單詞(之前版本為 3,000 個)。

  我們自己的研究工作表明,與依賴 LDA 和神經(jīng)網(wǎng)絡(luò)技術(shù)的主題建模技術(shù)相比,使用因子分析的主題建模產(chǎn)生的主題解決方案更加連貫和多樣化(Peladeau & Davoodi,2018 年;Peladeau,2022 年)。它還具有穩(wěn)定性的額外好處,每次都會產(chǎn)生相同的結(jié)果。然而,它的主要不便一直是它的速度和容量。這使我們在 WordStat 8 中實(shí)現(xiàn)了一個使用非負(fù)矩陣分解(或 NMF)的特殊主題提取例程。這種技術(shù)可以更快地產(chǎn)生結(jié)果,這些結(jié)果與使用因子分析獲得的結(jié)果非常相似。然而,它的概率實(shí)現(xiàn)會導(dǎo)致每次運(yùn)行的結(jié)果略有不同,這讓一些研究人員感到有些不安。重要的是要注意,計(jì)算機(jī)科學(xué)中幾乎所有其他流行的主題建模技術(shù)產(chǎn)生的主題解決方案甚至比我們自定義的 NMF 實(shí)現(xiàn)更不穩(wěn)定。那些尋求zui佳和穩(wěn)定的主題解決方案的人可能會喜歡新的因素分析主題建模例程的速度和容量大大提高。

  2.改進(jìn)了頻率頁面上的建議

  WordStat 早期版本中的“建議”面板顯示同義詞庫可用的語言的同義詞、反義詞和相關(guān)詞。它還提供了以相同首字母開頭的單詞,使人們能夠識別一些拼寫錯誤以及相關(guān)的單詞。一個新的關(guān)聯(lián)詞部分現(xiàn)在從文本語料庫中檢索與頻率表中所選詞在語義、句法和統(tǒng)計(jì)上相關(guān)的其他詞。這個新功能應(yīng)該適用于任何語言。默認(rèn)情況下,條目將按相關(guān)性降序排列。同義詞、反義詞和相關(guān)詞也會按照相關(guān)性降序排列,便于識別合適的建議。人們?nèi)匀荒軌虬醋帜疙樞蚧蝾l率降序?qū)@些條目進(jìn)行排序。此外,一個新的頻率過濾選項(xiàng)可以讓人們過濾掉低頻建議,讓人們專注于更頻繁的建議。

  由于這種提取相關(guān)詞和排序建議的新方法與語言無關(guān),因此對于分析沒有詞庫的語言的人來說尤其有用。然而,我們發(fā)現(xiàn),即使有這樣的語言資源,基于單詞上下文使用的額外建議,以及根據(jù)相關(guān)性對現(xiàn)有同義詞和相關(guān)單詞進(jìn)行排序,也應(yīng)該極大地促進(jìn)適當(dāng)項(xiàng)目的識別。

  3. 短語提取例程的新建議選項(xiàng)卡。

  重疊面板已替換為建議面板,除了重疊短語外,還顯示與短語頻率表中所選行在語義、句法或統(tǒng)計(jì)上相關(guān)的短語。此功能也與語言無關(guān)。

  4. 命名實(shí)體識別的改進(jìn)。

  命名實(shí)體識別頁面中添加了一個新的相關(guān)面板。選擇單個命名實(shí)體將帶來相關(guān)的命名實(shí)體,以及屬于同一類(人、地點(diǎn)、組織等)的命名實(shí)體。選擇一個特定類別的多個示例(例如,多個城市)也將檢索屬于該類別的更多項(xiàng)目。上下文菜單還允許將任何項(xiàng)目移動到分類詞典或排除列表中。還可以對選定的建議執(zhí)行上下文中的關(guān)鍵字搜索。

  5. 上下文關(guān)鍵詞表中上下文詞的突出顯示。

  在評估分類詞典中的詞或候選詞時,通常需要查看在目標(biāo)詞或短語出現(xiàn)的上下文中是否存在其他關(guān)鍵字。一種新的突出顯示功能允許人們指定要在單詞的周圍上下文中查找的單詞和短語列表。當(dāng)從主題建?;驑錉顖D中調(diào)用 KWIC 列表時,或者在評估包含多個條目的內(nèi)容類別中的項(xiàng)目時,會自動填充此列表。

  6.根據(jù)頻率或距原點(diǎn)的距離過濾對應(yīng)圖中的項(xiàng)目。

  超過幾百個項(xiàng)目的對應(yīng)圖可能會在圖的中心(原點(diǎn))創(chuàng)建一大堆重疊的項(xiàng)目。添加了一個新的滑塊控件以隱藏不太頻繁或接近此原點(diǎn)的項(xiàng)目。除非有人想確定一個自變量的所有類的共同點(diǎn),否則zui

  有趣的項(xiàng)目是那些遠(yuǎn)離原點(diǎn)的項(xiàng)目,因?yàn)樗鼈兪遣煌惖奶卣鳌_^濾掉這些項(xiàng)目可以讓人們更容易地識別不同的項(xiàng)目。

  7.改進(jìn)關(guān)鍵字檢索

  關(guān)鍵字搜索的結(jié)果現(xiàn)在按相關(guān)性降序排列,同時考慮匹配項(xiàng)的頻率和種類與檢索到的文本段的長度的關(guān)系。新的頻率列也可用于僅按頻率排序。

  8. 通過連接計(jì)算字符串變量

  一種新的數(shù)據(jù)轉(zhuǎn)換命令允許人們通過連接幾個現(xiàn)有變量(數(shù)字、字符串、日期等)的值以及鍵入的文本來計(jì)算字符串變量。這樣的過程也可用于用常量字符串值初始化字符串變量。

  9.持久對比圖設(shè)置

  這些比較圖表的圖表類型和統(tǒng)計(jì)數(shù)據(jù)以及調(diào)色板現(xiàn)在鏈接到變量名稱并存儲在項(xiàng)目設(shè)置中。這些選項(xiàng)應(yīng)該跨頁面(頻率、短語、主題建模、樹狀圖等)和會話之間保持不變,從而減少不斷重新調(diào)整這些選項(xiàng)的需要。

  軟件鏈接:

  //www.uone-tech.cn/wordstat.html

點(diǎn)擊進(jìn)入北京友萬信息科技有限公司展臺查看更多 來源:教育裝備采購網(wǎng) 作者:友萬科技 責(zé)任編輯:逯紅棟 我要投稿
校體購終極頁

版權(quán)與免責(zé)聲明:

① 凡本網(wǎng)注明"來源:教育裝備采購網(wǎng)"的所有作品,版權(quán)均屬于教育裝備采購網(wǎng),未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用。已獲本網(wǎng)授權(quán)的作品,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:教育裝備采購網(wǎng)"。違者本網(wǎng)將追究相關(guān)法律責(zé)任。

② 本網(wǎng)凡注明"來源:XXX(非本網(wǎng))"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),且不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如其他媒體、網(wǎng)站或個人從本網(wǎng)下載使用,必須保留本網(wǎng)注明的"稿件來源",并自負(fù)版權(quán)等法律責(zé)任。

③ 如涉及作品內(nèi)容、版權(quán)等問題,請?jiān)谧髌钒l(fā)表之日起兩周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

校體購產(chǎn)品