Bonjour a tous,
Voila mon souci j’ai un cluster de 3 nodes sur mongodb en version v4.0.16
et depuis quelques temps que ce soit nimporte lequel des nodes qui soit primary j’ai ceci
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
1609 mongodb 20 0 2197128 588084 40508 S 347,3 7,2 31500:50 mongod
350% de cpu…..
pour info 4vcpu sur chaque node
Volumetrie :
replconfig02:PRIMARY> show databases admin 0.000GB config 0.000GB fileDB 7.035GB fileDBBeta 0.023GB local 4.875GB ty_hangfire 0.052GB ty_hangfirebeta 0.000GB test 0.000GB
J’ai reussi a isoler ceci :
"secs_running" : NumberLong(3),
"microsecs_running" : NumberLong(3932686),
"op" : "getmore",
"ns" : "local.oplog.rs",
avec cette commande : db.currentOp({"secs_running": {$gte: 3}})
local.oplog.rs semble toucher a la replication.
J’ai réglé le probleme de log enorme mais ça n’a rien changé :
total 26M
drwxr-xr-x 2 mongodb mongodb 4,0K janv. 30 2019 .
drwxrwxr-x 13 root syslog 4,0K févr. 10 06:25 ..
-rw------- 1 mongodb mongodb 26M févr. 10 11:39 mongod.log
dans ce fameux log :
2020–02–10T11:41:18.286+0100 I NETWORK [conn25027] end connection 127.0.0.1:58738 (40 connections now open)
un peu plus d’info :
mongotop
2020-02-10T11:49:56.188+0100 connected to: 127.0.0.1
ns total read write 2020-02-10T11:49:57+01:00
ty_hangfire.hangfire.jobGraph 9425ms 0ms 9425ms
et
mongostat
insert query update delete getmore command dirty used flushes vsize res qrw arw net_in net_out conn set repl time
*0 16 13 *0 1 178|0 0.4% 13.6% 0 2.09G 573M 0|1 1|12 74.3k 895k 40 replconfig02 PRI Feb 10 11:53:04.583
*0 9 9 *0 0 188|0 0.4% 13.6% 0 2.09G 573M 0|0 2|11 73.5k 131k 40 replconfig02 PRI Feb 10 11:53:05.586
*0 12 9 *0 1 189|0 0.4% 13.6% 0 2.09G 573M 0|0 1|12 75.0k 858k 40 replconfig02 PRI Feb 10 11:53:06.583
*0 *0 *0 1 1 205|0 0.4% 13.6% 0 2.09G 573M 0|0 2|14 76.5k 119k 40 replconfig02 PRI Feb 10 11:53:07.583
*0 3 *0 *0 1 203|0 0.4% 13.6% 0 2.09G 573M 0|0 1|11 72.0k 845k 40 replconfig02 PRI Feb 10 11:53:08.583
*0 1 *0 3 4 225|0 0.4% 13.6% 0 2.09G 573M 0|0 2|9 84.7k 126k 40 replconfig02 PRI Feb 10 11:53:09.583
*0 2 *0 *0 2 200|0 0.4% 13.6% 0 2.09G 573M 0|0 1|10 73.2k 847k 40 replconfig02 PRI Feb 10 11:53:10.584
*0 1 *0 3 3 211|0 0.4% 13.6% 0 2.09G 573M 0|0 1|11 79.2k 122k 40 replconfig02 PRI Feb 10 11:53:11.583
Quelqu’un aurait une piste pour moi ?
D’avance merci.