一千萬個為什麽

搜索

從MATLAB Web瀏覽器保存html頁面

這個問題之後,我在檢索到的頁面上收到一條消息“您的瀏覽器不支持JavaScript,因此可能缺少某些功能!

如果我在MATLAB Web瀏覽器中使用 web(url)打開此頁面並接受證書(每個會話一次),頁面將正確打開。

如何使用腳本從瀏覽器保存頁面源?還是從系統瀏覽器?或者可能有一種方法可以在沒有瀏覽器的情況下獲得該頁面?

url='https://cgwb.nci.nih.gov/cgi-bin/hgTracks?position=chr7:55054218-55242525';

最佳答案

從我可以告訴頁面源下載得很好,只需確保在本地打開保存頁面時讓Javascript運行。

[...]
<script type='text/javascript' src='../js/hgTracks.js'></script>

[...]

請註意,您是解決方案使用時只下載沒有任何附加內容的網頁(圖片,.css,.js等)。

你可以做的是調用 wget 來獲取包含所有文件的頁面:

url = 'https://cgwb.nci.nih.gov/cgi-bin/hgTracks?position=chr7:55054218-55242525';
command = ['wget --no-check-certificate --page-requisites ' url];
system( command );

如果您使用的是Windows計算機,則始終可以從GnuWin32項目或許多其他實施

轉載註明原文: 從MATLAB Web瀏覽器保存html頁面