在多數(shù)情況下,專利分析是基于各種專利數(shù)據(jù)進(jìn)行的,因此專利分析中的一項(xiàng)重要工作是分析處理專利數(shù)據(jù)。雖然多種工具(如Excel和一些專利分析系統(tǒng))已被用于分析專利數(shù)據(jù),但利用這些工具應(yīng)對(duì)某些復(fù)雜分析時(shí)仍存在一些問(wèn)題。例如,在使用Excel時(shí)需要靈活運(yùn)用Excel函數(shù),這無(wú)疑增加了分析人員的工具學(xué)習(xí)成本。而多數(shù)專利分析系統(tǒng)是通過(guò)運(yùn)行分析模板實(shí)現(xiàn)既定的分析任務(wù),因此其提供的分析功能有限,難以滿足分析人員的多種分析需求。因此,專利分析迫切需要操作簡(jiǎn)便、功能**的分析工具,以幫助分析人員**有效地完成分析工作。
Power BI(下稱PBI)是微軟公司推出的一套用于商業(yè)數(shù)據(jù)分析的交互式可視化數(shù)據(jù)分析工具,其兼具數(shù)據(jù)獲取、加工、建模和可視化多種數(shù)據(jù)處理和分析功能,能夠?qū)崿F(xiàn)多數(shù)據(jù)源的數(shù)據(jù)整合、數(shù)據(jù)模型的建立、數(shù)據(jù)可視化圖表的交互式呈現(xiàn),其操作簡(jiǎn)便,降低了工具的使用門檻。此外,PBI能夠通過(guò)建立多數(shù)據(jù)表間關(guān)系形成數(shù)據(jù)模型,由此能夠利用多維度數(shù)據(jù)信息進(jìn)行分析。同時(shí),PBI中形成的圖表能夠以人機(jī)交互方式動(dòng)態(tài)呈現(xiàn)關(guān)聯(lián)數(shù)據(jù)的信息——相比靜態(tài)圖表能夠提供更為豐富的數(shù)據(jù)信息,便于分析者就此發(fā)掘價(jià)值信息。
雖然PBI主要應(yīng)用于商業(yè)數(shù)據(jù)分析,但其仍然屬于數(shù)據(jù)分析工具,因而理論上同樣能夠適用于專利數(shù)據(jù)的分析。本文試將PBI用于專利數(shù)據(jù)分析,通過(guò)借助該工具操作簡(jiǎn)便和功能**的優(yōu)勢(shì),嘗試完成一些較為復(fù)雜的專利數(shù)據(jù)分析任務(wù),以期為專利分析人員提供參考。
數(shù)據(jù)建模
由于專利數(shù)據(jù)間的關(guān)系復(fù)雜,進(jìn)行數(shù)據(jù)間的分析往往難度很大。例如,一般情況下,一項(xiàng)專利文獻(xiàn)會(huì)對(duì)應(yīng)多個(gè)發(fā)明人。如果一件專利申請(qǐng)為共同申請(qǐng),還會(huì)對(duì)應(yīng)多個(gè)申請(qǐng)人。在一些分析場(chǎng)景中,如何將上述多種數(shù)據(jù)信息相互關(guān)聯(lián)以實(shí)現(xiàn)相互分析仍有一定難度。
PBI能夠通過(guò)多種數(shù)據(jù)關(guān)系表中的共有數(shù)據(jù)字段建立各關(guān)系表間的關(guān)聯(lián),即實(shí)現(xiàn)數(shù)據(jù)建模,并允許分析過(guò)程中不同關(guān)系表中數(shù)據(jù)間相互篩選分析。對(duì)于前述分析場(chǎng)景,可以分別就“公開號(hào)-**名稱”“公開號(hào)-申請(qǐng)人”和“公開號(hào)-發(fā)明人”建立獨(dú)立的關(guān)聯(lián)表格,同時(shí)由于這些表格均含有與原始數(shù)據(jù)相對(duì)應(yīng)的“公開號(hào)”字段,因此能夠以“公開號(hào)”字段作為橋梁建立申請(qǐng)人、發(fā)明人和**數(shù)據(jù)的聯(lián)系,由此構(gòu)建數(shù)據(jù)模型。
交互聯(lián)動(dòng)
在數(shù)據(jù)建模的基礎(chǔ)上,通過(guò)PBI能夠快速完成可視化圖表的繪制。在PBI中繪制圖表僅需如下三步:選擇所需的可視化圖表類型,將要分析的字段拖動(dòng)到圖表數(shù)據(jù)欄中,必要時(shí)可在圖表屬性中調(diào)整圖表格式即可完成繪制。
在不同數(shù)據(jù)表建立關(guān)系后,在PBI中還能夠通過(guò)不同數(shù)據(jù)表中的字段進(jìn)行可視化圖表繪制,即分析不同數(shù)據(jù)表中字段的數(shù)據(jù)關(guān)系。對(duì)于前文提到的兩個(gè)數(shù)據(jù)分析問(wèn)題,能夠分別通過(guò)可視化方案“ZoomCharts Network Chart”和“弦圖”將“申請(qǐng)人-發(fā)明人-專利申請(qǐng)量”“申請(qǐng)來(lái)源國(guó)-申請(qǐng)目標(biāo)國(guó)”數(shù)據(jù)可視化。在圖表繪制后便可以通過(guò)其交互特性進(jìn)行多角度分析。例如,在“申請(qǐng)人-發(fā)明人-專利申請(qǐng)量”圖中選中其中一個(gè)申請(qǐng)人,則會(huì)使“申請(qǐng)來(lái)源國(guó)-申請(qǐng)目標(biāo)國(guó)”圖中自動(dòng)篩選對(duì)應(yīng)申請(qǐng)人的專利申請(qǐng)流向信息。再如,在“申請(qǐng)來(lái)源國(guó)-申請(qǐng)目標(biāo)國(guó)”圖中選擇某一**,則“申請(qǐng)人-發(fā)明人-專利申請(qǐng)量”圖則會(huì)僅顯示相應(yīng)**的申請(qǐng)人及其發(fā)明人情況。
上面例子簡(jiǎn)單展示了PBI可視化的交互特性,為了進(jìn)一步說(shuō)明其在專利分析中的應(yīng)用價(jià)值,下面通過(guò)實(shí)際分析情景進(jìn)一步說(shuō)明。
專利分析其中一個(gè)分析項(xiàng)目是申請(qǐng)人分析,具體需要就申請(qǐng)人的專利申請(qǐng)情況、專利布局分布、發(fā)明人員情況以及重點(diǎn)專利和技術(shù)脈絡(luò)等問(wèn)題進(jìn)行梳理和分析。為此,利用PBI分別繪制出“申請(qǐng)人申請(qǐng)量排名”“申請(qǐng)流向”“申請(qǐng)量趨勢(shì)”“發(fā)明人數(shù)量趨勢(shì)”以及“技術(shù)主題分布”可視化圖表,并將其布置于同一報(bào)表頁(yè)面中(注:PBI中可視化方案均可通過(guò)復(fù)制/剪切方式重復(fù)/移動(dòng)可視化方案),由此便能夠利用這些圖表聯(lián)動(dòng)即時(shí)分析多個(gè)申請(qǐng)人的相關(guān)數(shù)據(jù)情況。在具體分析操作中,在“申請(qǐng)人申請(qǐng)量排名”表中選中特定申請(qǐng)人,由此便會(huì)使其他圖表顯示/突出顯示該申請(qǐng)人的在申請(qǐng)流向、申請(qǐng)量趨勢(shì)、發(fā)明人數(shù)量趨勢(shì)以及技術(shù)主題分布的信息。在“申請(qǐng)人申請(qǐng)量排名”表中改變選中的申請(qǐng)人,則相應(yīng)信息依申請(qǐng)人選擇改變而相應(yīng)調(diào)整,因此可以即時(shí)顯示不同申請(qǐng)人的相關(guān)信息,而無(wú)需重復(fù)繪制同類圖表。
為了進(jìn)一步分析特定申請(qǐng)人的專利技術(shù)情況,可以創(chuàng)建第二個(gè)分析報(bào)表,其中保留了**個(gè)分析報(bào)表中的技術(shù)主題分布圖,在此基礎(chǔ)上加入了專利文獻(xiàn)的引用關(guān)系圖(利用專利引用數(shù)據(jù)并采用可視化方案“Network Navigator”繪制)和申請(qǐng)人數(shù)據(jù)的切片器。其中,文獻(xiàn)引用關(guān)系圖中會(huì)以節(jié)點(diǎn)形式表示一個(gè)專利族,并在節(jié)點(diǎn)旁顯示該專利族的一個(gè)專利的公開號(hào)以作為該族代表,節(jié)點(diǎn)間連線表示其具有引用關(guān)系,節(jié)點(diǎn)大小以該專利族被引用頻次設(shè)定,由此能夠清楚發(fā)現(xiàn)高引用頻次專利,有利于判斷專利族的重要程度。在針對(duì)特定申請(qǐng)人進(jìn)行分析時(shí),可以在切片器中選擇該申請(qǐng)人,由此使該報(bào)表中其他可視化圖表均僅顯示該申請(qǐng)人相應(yīng)數(shù)據(jù),即顯示該申請(qǐng)人的技術(shù)主題分布、專利文獻(xiàn)引用關(guān)系圖。該可視化方案有助于迅速發(fā)現(xiàn)不同技術(shù)主題下申請(qǐng)人的高頻引用專利,同時(shí)文獻(xiàn)引用關(guān)系也能夠?qū)τ谑崂碓撋暾?qǐng)人該技術(shù)主題的技術(shù)脈絡(luò)提供幫助。
通過(guò)上面的實(shí)例能夠看出,PBI中通過(guò)多種可視化圖表的組合能夠衍生出多種維度的分析,以滿足多種分析場(chǎng)景的要求。同時(shí),由于各圖表間的相互聯(lián)動(dòng)呈現(xiàn),事實(shí)上特定字段間的可視化圖表僅需要制作一次,便可結(jié)合其他圖表展現(xiàn)出更多數(shù)據(jù)維度的情況,這相比靜態(tài)圖具有更高的效率。
綜上所述,Power BI雖然并非專利分析的專用工具,但其在數(shù)據(jù)分析方面操作簡(jiǎn)單、功能**。Power BI數(shù)據(jù)建模支持多維度數(shù)據(jù)的協(xié)同利用,可視化圖表繪制便捷,可視化交互聯(lián)動(dòng)允許分析者根據(jù)分析需要靈活創(chuàng)建分析場(chǎng)景,能夠真正用于專利數(shù)據(jù)分析中,滿足多變、深入的分析需求,并且相比靜態(tài)圖表具有更高的制圖效率。這有利于使分析者從圖表繪制的繁雜低產(chǎn)出工作中解放出來(lái),而聚焦分析本身,進(jìn)而促進(jìn)專利分析質(zhì)量的提高。(趙佳睿 左良軍 危峰)
?。ň庉嫞翰苎艜煟?