On Wed, Jun 20, 2012 at 2:57 PM, Hongfeng Yang <span dir="ltr">&lt;<a href="mailto:hyang@whoi.edu" target="_blank">hyang@whoi.edu</a>&gt;</span> wrote:<br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi Jonathan,<br>
<br>
Then I need to turn on the debugger in the code. How should I set xterm<br>
display in order to attach gdp?<br></blockquote><div><br></div><div>Just to clarify:</div><div><br></div><div>  The situation is that we have run successfully on a single node (12 processes), but</div><div>at 24 processes we get a SEGV. It appears to be during file access, but the best way</div>
<div>to debug this error would be to use the debugger.</div><div><br></div><div>PETSc has the ability to spawn and attach gdb to make this possible in parallel. On other</div><div>clusters, we have just set the DISPLAY env var to enable the xterm to spawn on the user</div>
<div>machine. Hopefully this is possible on this cluster.</div><div><br></div><div>  Thanks,</div><div><br></div><div>     Matt</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Thanks,<br>
<br>
Hongfeng<br>
<br>
On 6/20/12 2:32 PM, Jonathan Murray wrote:<br>
&gt; we use nfs to access the filesystem<br>
&gt; the filesystem is either xfs or ext4<br>
&gt;<br>
&gt; how are you submitting your jobs? is there a shell script?<br>
&gt;<br>
&gt; thanks<br>
&gt;<br>
&gt; On 06/20/2012 04:18 PM, Hongfeng Yang wrote:<br>
&gt;&gt; Hi Jonathan,<br>
&gt;&gt;<br>
&gt;&gt; I am running a software on the cluster scylla. So far I can run the code<br>
&gt;&gt; on ONE compute node, but could not get it proceed on two or more nodes.<br>
&gt;&gt;<br>
&gt;&gt; The code developers suspect that it could be related to the filesystem<br>
&gt;&gt; on our cluster as the code gets stuck in reading the mesh. Do you know<br>
&gt;&gt; what kind of filesystems are on the master and compute nodes on scylla?<br>
&gt;&gt;<br>
&gt;&gt; Thanks,<br>
&gt;&gt;<br>
&gt;&gt; Hongfeng<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; -------- Original Message --------<br>
&gt;&gt; Subject:     Re: Error message from running on cluster<br>
&gt;&gt; Date:        Wed, 20 Jun 2012 08:01:18 -0600<br>
&gt;&gt; From:        Matthew Knepley&lt;<a href="mailto:knepley@mcs.anl.gov">knepley@mcs.anl.gov</a>&gt;<br>
&gt;&gt; To:  Hongfeng Yang&lt;<a href="mailto:hyang@whoi.edu">hyang@whoi.edu</a>&gt;<br>
&gt;&gt; CC:  <a href="mailto:cig-short@geodynamics.org">cig-short@geodynamics.org</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Wed, Jun 20, 2012 at 7:18 AM, Hongfeng Yang&lt;<a href="mailto:hyang@whoi.edu">hyang@whoi.edu</a><br>
&gt;&gt; &lt;mailto:<a href="mailto:hyang@whoi.edu">hyang@whoi.edu</a>&gt;&gt;  wrote:<br>
&gt;&gt;<br>
&gt;&gt;      Hi Matt,<br>
&gt;&gt;<br>
&gt;&gt;      Last night I did not send the error message of running pylith on our<br>
&gt;&gt;      cluster at WHOI. Sorry for that. Here it is.<br>
&gt;&gt;<br>
&gt;&gt;      Could you help figure out what the problem might be?<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; So it looks like there is a problem when trying to read in the mesh,<br>
&gt;&gt; although it is hard to tell since<br>
&gt;&gt; we get an SEGV. My guess is that the filesystem is not exactly what you<br>
&gt;&gt; think it is.I recommend<br>
&gt;&gt; going through the cluster documentation to understand exactly how the<br>
&gt;&gt; filesystem is accessed from<br>
&gt;&gt; nodes other than the head node.<br>
&gt;&gt;<br>
&gt;&gt;     Matt<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;      Thanks,<br>
&gt;&gt;<br>
&gt;&gt;      Hongfeng<br>
&gt;&gt;<br>
&gt;&gt;      --<br>
&gt;&gt;      Postdoctoral Investigator<br>
&gt;&gt;      Department of Geology and Geophysics<br>
&gt;&gt;      Woods Hole Oceanographic Institution<br>
&gt;&gt;      360 Woods Hole Rd, MS 24<br>
&gt;&gt;      Woods Hole, MA 02543<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
<span class="HOEnZb"><font color="#888888">&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt; What most experimenters take for granted before they begin their<br>
&gt;&gt; experiments is infinitely more interesting than any results to which<br>
&gt;&gt; their experiments lead.<br>
&gt;&gt; -- Norbert Wiener<br>
&gt;&gt;<br>
&gt;<br>
<br>
<br>
--<br>
Postdoctoral Investigator<br>
Department of Geology and Geophysics<br>
Woods Hole Oceanographic Institution<br>
360 Woods Hole Rd, MS 24<br>
Woods Hole, MA 02543<br>
<br>
_______________________________________________<br>
CIG-SHORT mailing list<br>
<a href="mailto:CIG-SHORT@geodynamics.org">CIG-SHORT@geodynamics.org</a><br>
<a href="http://geodynamics.org/cgi-bin/mailman/listinfo/cig-short" target="_blank">http://geodynamics.org/cgi-bin/mailman/listinfo/cig-short</a><br>
</font></span></blockquote></div><br><br clear="all"><div><br></div>-- <br>What most experimenters take for granted before they begin their experiments is infinitely more interesting than any results to which their experiments lead.<br>
-- Norbert Wiener<br>