0%

本文用于个人的总结

PS:根据我浏览的顺序进行罗列,方法没有好坏之分

  • 利用现有的成型工具,在进行 HTML 转 markdown 的时候, 对表格数据的处理并不是很友好,故而浏览记录总结
    • 我才不会告诉你,是我自己看的乱掉啦</p>
    • 我才不会告诉你,是我自己看乱掉啦
阅读全文 »

本文仅作为个人记录用
添加:

  1. 进度条
  2. 网站的建站时间
  3. 显示近期文章
  4. 显示当前浏览进度
  5. 代码块复制功能
  6. 自定义样式博文加密
  7. 添加网易云音乐
阅读全文 »

Pytorch中Torch 工具包的数学操作汇总速查

torch package 包含了多维张量的数据结构, 以及基于其上的多种数学操作. 此外,它还提供了许多用于高效序列化 Tensor 和任意类型的实用工具包, 以及一起其它有用的实用工具包.

阅读全文 »



模型
代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
import torch.nn.functional as F
from torch import nn


class SelfAttention(nn.Module):

def __init__(self, input_size, hidden_size):
super(SelfAttention, self).__init__()
self.W = nn.Linear(input_size, hidden_size, True)
self.u = nn.Linear(hidden_size, 1)

def forward(self, x):
u = torch.tanh(self.W(x))
a = F.softmax(self.u(u), dim=1)
x = a.mul(x).sum(1)
return x


class HAN(nn.Module):

def __init__(self):
super(HAN1, self).__init__()
num_embeddings = 5844 + 1
num_classes = 10
num_sentences = 30
num_words = 60

embedding_dim = 200 # 200
hidden_size_gru = 50 # 50
hidden_size_att = 100 # 100

self.num_words = num_words
self.embed = nn.Embedding(num_embeddings, embedding_dim, 0)

self.gru1 = nn.GRU(embedding_dim, hidden_size_gru, bidirectional=True, batch_first=True)
self.att1 = SelfAttention(hidden_size_gru * 2, hidden_size_att)

self.gru2 = nn.GRU(hidden_size_att, hidden_size_gru, bidirectional=True, batch_first=True)
self.att2 = SelfAttention(hidden_size_gru * 2, hidden_size_att)

# 这里fc的参数很少,不需要dropout
self.fc = nn.Linear(hidden_size_att, num_classes, True)

def forward(self, x):
# 64 512 200
x = x.view(x.size(0) * self.num_words, -1).contiguous()
x = self.embed(x)
x, _ = self.gru1(x)
x = self.att1(x)
x = x.view(x.size(0) // self.num_words, self.num_words, -1).contiguous()
x, _ = self.gru2(x)
x = self.att2(x)
x = self.fc(x)
x = F.log_softmax(x, dim=1) # softmax
return x

论文: Hierarchical Attention Networks for Document Classification

阅读全文 »