起步软件技术论坛-X3

 找回密码
 立即注册
搜索
查看: 341|回复: 11

紧急求助:节点挂掉时出错日志**

[复制链接]
发表于 2008-1-24 11:07:34 | 显示全部楼层 |阅读模式
在用户上线一个月的过程中,当用户量逐渐增大的时候,应用服务器的两个节点会频繁的挂掉,而且最多的时候一天挂掉8次,目前还不清楚到底是什么原因。系统的应用环境是这样的:
1、数据库服务器一台,高端小型机,已经做过性能优化,配置应该没有问题;
2、两台应用数据库服务器,WAS5.1,部署集群,其中ND和http部署在其中一个节点上。每台服务器是8G内存,8颗CPU,操作系统都是WIN2003 64位,安装了两个加密狗。

出错日志见附件,我们发现可能存在问题的地方有以下两点:
1、Connection reset by peer: socket write error在日志中出现频率非常高,有103处,节点没有当机前也会出现

2、在 bean“BeanId(BizServer_jar#BizServer.jar#StatelessBizServer, null)”上处理方法“getDeltaRecords”时发生非应用程序异常。异常数据:java.lang.OutOfMemoryError,这个有3处

systemout_08.01.23_21.16.18.rar

39.31 KB, 下载次数: 109

回复

使用道具 举报

 楼主| 发表于 2008-1-24 11:08:57 | 显示全部楼层
很急,在线等待
回复 支持 反对

使用道具 举报

发表于 2008-1-24 11:35:11 | 显示全部楼层
楼主在升级之前的很少使用的时间段内能不能主动的重启一下服务,比如中午或者早上上班前,这样可以减少服务死掉的次数。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-1-24 11:43:55 | 显示全部楼层
这些方法我们都已经在使用了,不过这是治标不治本的方法,还是要尽快找到原因,况且我们系统属于24小时的业务系统,基本上每个时段都会有人使用,也很难找到合适的重启服务的机会。目前发现的一个情况是:
节点的java.exe平常的CPU占用不高,一般是20%左右,然后在某一瞬间CPU占用率就到了100%,然后节点就挂掉了。
回复 支持 反对

使用道具 举报

发表于 2008-1-24 11:48:27 | 显示全部楼层
看一下系统数据库中本地业务数据缓存表有多少条数据?
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-1-24 12:05:33 | 显示全部楼层
本地业务数据缓存表是sys用户下的哪张表呀?之前没有接触过,2401版本有这张表吗?
回复 支持 反对

使用道具 举报

发表于 2008-1-24 13:07:31 | 显示全部楼层
本地业务数据缓存日志表
在系统数据库中。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2008-1-24 13:58:10 | 显示全部楼层
是tbizdatacachelog(数据量15680条)还是tfilecachelog(300815条)呢?
回复 支持 反对

使用道具 举报

发表于 2008-1-24 15:22:19 | 显示全部楼层
楼主上面的数据量太大了,这样服务端内存使用肯定会很大,
备份一下数据库然后做以下操作:

楼主把tbizdatacachelog表的数据清空
然后使用开发端带的doctor工具初始化一下tfilecachelog表的数据,初始化以后这个表应该只有1条数据。

doctor.png

24.82 KB, 下载次数: 162

回复 支持 反对

使用道具 举报

发表于 2008-1-24 15:41:29 | 显示全部楼层
Connection reset by peer: socket write error
参考 http://www.lookcode.net/Article/list/6/112872.aspx
说是升级WAS的补丁,不知道对你是否有帮助
==========================
[07-4-18 9:19:57:031 CST] 1f7a20d0 SystemErr     R java.net.SocketException: Connection reset by peer: socket closed
[07-4-19 9:32:23:328 CST] 7e02d14f WebGroup      E SRVE0026E: [Servlet 错误]-[Connection reset by peer: socket write error]:java.net.SocketException: Connection reset by peer: socket write error
错误:SRVE0026E,servlet错误,Socket写入错误
       类似这种错误,我以前解决了一个更加怪异的。WAS5+SQLSERVER2000SP4采用ODBC数据源连接时,不出现这种错误,而采用JDBC则出现这种错误.解决办法:不使用SP4,使用SQL SERVER SP3A即可解决。
       SRVE0026E错误,请升级WAS补丁到5.1即可解决数据库访问并发释放连接、socket写入错误等问题
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Justep Inc.

GMT+8, 2025-7-6 04:11 , Processed in 0.043871 second(s), 18 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表