查看: 162|回复: 2|关注: 0

[已解决] 如何将一个 html 网页读入 MATLAB?同时,希望丢弃所有的 HTML 标签。

[复制链接]

MATLAB 基础讨论
版块优秀回答者

27

主题

54

帖子

28

最佳答案
  • 关注者: 2
如何将一个 html 网页读入 MATLAB?同时,希望丢弃所有的 HTML 标签。

MATLAB 基础讨论
版块优秀回答者

27

主题

54

帖子

28

最佳答案
  • 关注者: 2
 楼主| 发表于 2019-10-31 16:47:45 | 显示全部楼层 |此回复为最佳答案
读取网页可以采用 webread 函数。对于去除标签,暂时没有直接实现的函数,但这个功能可以通过正则表达式实现,例如:

  1. str = '<HTML>My flowers <b>may</b> <A HREF=''<http://www.a.com'' http://www.a.com''>bloom in</A> May</HTML>';
  2. pat = '<[^>]*>';
  3. regexprep(str, pat, '')
复制代码



答案来源:
https://www.mathworks.com/matlabcentral/answers/98555-how-can-i-read-an-html-file-into-matlab-and-discard-the-html-tags
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐上一条 /3 下一条

快速回复 返回顶部 返回列表